Athlon 64 X2

Embora o Athlon fosse um processador muito mais eficiente que o Pentium 4, a AMD também logo atingiu os limites de operação do projeto, chegando aos 2.6 GHz com os processadores de 90 nm e aos 2.8 GHz com o Lima de 65 nm. A solução para continuar lançando versões mais rápidas foi a mesma da Intel: investir no desenvolvimento de processadores dual-core.

As primeiras versões do Athlon 64 foram lançadas em 2005, em resposta ao lançamento do Pentium D baseado no core Presler. Do ponto de vista técnico, o Athlon X2 era bem mais avançado que o Pentium D, já que além da questão da arquitetura, ele era um processador dual-core nativo, e não um processador dual-chip.

No Presler tínhamos dois processadores separados, que compartilhavam o mesmo encapsulamento (daí o dual-chip). Toda a comunicação entre os dois cores; e, entre eles e o chipset, era feita através do FSB, um barramento lento para acumular as duas funções.

A AMD por outro lado utilizou um projeto bastante moderno no Athlon X2, construindo os dois núcleos sobre o mesmo wafer e utilizando um novo barramento interno para a comunicação entre eles, batizado de SRI (System Request Interface). Isso garantiu tempos de latência mais baixos e pequenos ganhos de desempenho ao rodar muitos aplicativos simultaneamente (que é justamente a área em que os processadores dual-core oferecem mais vantagens), além de permitir que o processador fosse capaz de operar a frequências um pouco mais altas do que seria possível com um design dual-chip.

Na camada mais externa, temos o “Crossbar Switch”, responsável por dividir as requisições entre os dois cores, controlar o acesso de ambos ao controlador de memória (e ao barramento HyperTransport), além de monitorar o nível de carregamento de cada um, informação utilizada, entre outras coisas, pelo sistema de gerenciamento de energia.

Este diagrama da AMD mostra o conceito. Note que no diagrama são indicados dois links de 72 bits com a memória (suporte a ECC) e três links HyperTransport, que são recursos presentes apenas no Opteron (a versão para servidores). No Athlon X2 doméstico é usado um único link HyperTransport e os controladores de memória trabalham em conjunto com módulos DDR2 regulares, com dois links de 64 bits.

Diagrama de blocos do X2

Cada processador possui seu próprio cache L2, mas ambos compartilham o mesmo controlador de memória e o mesmo barramento HyperTransport, através do qual é feita toda a comunicação com o chipset e os demais componentes do PC.

Olhando uma foto ampliada do processador, você pode notar que os dois núcleos ficam na parte central superior, envoltos pelos circuitos referentes ao controlador de memória e HyperTransport e separados pelos circuitos referentes ao SRI e ao Crossbar Switch. Outra peculiaridade é que o segundo núcleo é uma cópia espelhada do primeiro, o que permite que ambos façam contato com os componentes centrais nos mesmos pontos:

Componentes internos do X2

Componentes internos do X2

O uso de dois núcleos torna o processador mais dependente do barramento com a memória. Devido a isso, o Athlon 64 X2 foi lançado apenas em versões soquete 939, AM2 e AM2+, já que uma versão soquete 754 seria penalizada pelo barramento single-channel. O lançamento do Athlon X2 acelerou a migração para as placas soquete 939, transformando a plataforma 754 em uma opção de baixo custo, destinada ao Sempron e às versões mais lentas do Athlon 64. Pouco tempo depois, ambas foram substituídas pela plataforma AM2, que inaugurou o uso de memórias DDR2.

Ao contrário do que teríamos ao utilizar dois processadores separados em SMP, um processador dual-core atual como o Athlon X2, Pentium D ou Core 2 Duo não consomem o dobro de energia que as versões single-core. Isto é possível graças a sistemas de gerenciamento de energia incluídos no processador, que reduzem a frequência ou mesmo desativam completamente o segundo núcleo quando o processador está ocioso. No caso do Athlon X2, muitos componentes são compartilhados entre os dois processadores, o que aumenta a economia.

Se comparado com um Athlon 64 4000+ com core San Diego (que também opera a 2.4 GHz), um Athlon X2 4800+ Toledo (2.4 GHz, 1 MB) consome cerca de 12 watts a mais enquanto o sistema está ocioso e 24 watts a mais ao rodar um benchmark. Considerando que o TDP do San Diego é de 89 watts, o aumento não é tão significativo.

Um aplicativo que conseguisse utilizar simultaneamente todo o processamento de ambos os cores poderia, em teoria, fazer com que o consumo chegasse a ser momentaneamente próximo do dobro, mas em situações reais isto não acontece com frequência.

A carreira do X2 começou com o core Manchester, lançado em maio de 2005. Ele era fabricado usando uma técnica de 0.09 micron, com 512 KB de cache L2 por core (1 MB no total) e suporte às instruções SS3. A versão mais lenta tinha metade do cache L2 desabilitado, de forma a aproveitar os cores com defeitos no cache. Ele foi usado em quatro modelos:

Athlon 64 X2 4600+: 2.4 GHz, 2x 512 KB, soquete 939
Athlon 64 X2 4200+: 2.2 GHz, 2x 512 KB, soquete 939
Athlon 64 X2 3800+: 2.0 GHz, 2x 512 KB, soquete 939
Athlon 64 X2 3600+: 2.0 GHz, 2x 256 KB, soquete 939

O seguinte foi o core Toledo, ainda produzido usando uma técnica de 0.09 micron, mas agora com 1 MB de cache por core, totalizando 2 MB. Ele foi lançado simultaneamente com o Manchester, e os modelos do X2 baseados em ambos conviveram durante mais de um ano.

Apenas três dos modelos produzidos utilizando o core Toledo vieram com todo o cache ativo. Os demais vinham com metade do cache desativado, o que os tornava praticamente indistinguíveis dos baseados no Manchester. O Toledo foi utilizado nos modelos:

Athlon 64 X2 4800+: 2.4 GHz, 2x 1 MB, soquete 939
Athlon 64 X2 4600+: 2.4 GHz, 2x 512 KB, soquete 939
Athlon 64 X2 4400+: 2.2 GHz, 2x 1 MB, soquete 939
Athlon 64 X2 4200+: 2.2 GHz, 2x 512 KB, soquete 939
Athlon 64 X2 3800+: 2.0 GHz, 2x 512 KB, soquete 939

Quase um ano depois, em maio de 2006, foi lançado o Windsor, que passou a utilizar o soquete AM2 (com a consequente migração para as memórias DDR2) e adicionou suporte ao AMD-V, mantendo a mesma técnica de produção de 0.09 micron e o uso de 2x 1 MB de cache. Assim como no Toledo, uma grande parte dos modelos vinham com metade do cache L2 desabilitado e eram vendidos sob índices de desempenho mais baixos que os “completos”.

Diferente do que fez com as séries iniciais do Athlon 64, a AMD não aproveitou o ganho derivado do barramento mais largo com a memória para engordar o índice de desempenho dos processadores em relação aos modelos do Toledo. Apesar disso, o Windsor foi bem adiante em termos de frequência de operação, chegando aos 3.0 GHz:

Athlon 64 X2 6000+: 3.0 GHz, 2x 1 MB, soquete AM2
Athlon 64 X2 5600+: 2.8 GHz, 2x 1 MB, soquete AM2
Athlon 64 X2 5400+: 2.8 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 5200+: 2.6 GHz, 2x 1 MB, soquete AM2
Athlon 64 X2 5000+: 2.6 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4600+: 2.4 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4400+: 2.2 GHz, 2x 1 MB, soque AM2
Athlon 64 X2 4200+: 2.2 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4000+: 2.0 GHz, 2x 1 MB, soquete AM2
Athlon 64 X2 3800+: 2.0 GHz, 2x 512 KB, soquete AM2

Todos os modelos baseados no core Windsor possuem um TDP de 89 watts, assim como a maior parte das versões baseadas nos cores Manchester e Toledo. A exceção fica por conta do 6000+, que apesar da diferença de apenas 200 MHz em relação ao 5600+, possui um TDP de 125 watts. Esta diferença tão grande é causada pelo gate leakage, o mesmo problema que a Intel enfrentou com o Pentium 4 ao cruzar a barreira dos 3.0 GHz e que às vezes enfrentamos ao fazer overclocks agressivos.

A partir de uma certa frequência (que varia de acordo com a arquitetura), os transistores passam a desperdiçar cada vez mais energia, de forma que é necessário utilizar uma tensão cada vez mais alta para estabilizar o processador (aumento que aumenta ainda mais o desperdício de energia), criando um ciclo vicioso que se intensifica a cada novo aumento de frequência.

O 6000+ é basicamente uma versão overclocada do 5600+, onde a tensão foi aumentada de 1.30 para 1.35V para estabilizar o processador. Apesar de ser o mais rápido dentro da série, ele acabou se tornando um modelo indesejável, já que era mais caro e mais gastador.

Como uma opção para quem prefere um processador mais econômico e frio, a AMD lançou a série “Energy Efficient“, composta por modelos com um consumo mais baixo (baseados em uma nova técnica de produção), ou por unidades selecionadas de uma série existente, capaz de operar estavelmente com tensões mais baixas.

A série Energy Efficient do Windsor, por exemplo, abrange modelos do 3600+ (2.0 GHz, 2x 1MB, soquete AM2) ao 5200+ (2.6 GHz, 2x 1MB, soquete AM2), todos com tensão de 1.2v e TDP de 65 watts. Eles eram mais caros que os da série regular, com o preço variando de acordo com o clock (nas frequências mais altas, a diferença nos preços finais no Brasil podia ser de quase 200 reais, enquanto nos modelos populares a diferença caía para apenas 30 ou 50 reais). De uma forma geral, os modelos Energy Efficient valem a pena em casos em que a diferença de preço é pequena, pois a economia de energia acaba se pagando com o passar do tempo. Em um PC que fica ligado continuamente, uma economia de 24 watts acaba resultando em uma redução de mais de 200 reais na conta de luz ao longo de dois anos.

Mais tarde, a série Energy Efficient deu origem a outras séries de baixo consumo, incluindo a série “e” e a série “LE” que, dependendo da série, são compostas por revisões de baixo consumo (que incorporam o uso de transistores de chaveamento mais lento e outras técnicas derivadas dos processadores móveis), ou simplesmente serem compostos por modelos selecionados, com tensão e clock mais baixo.

Por último, temos o Brisbane, a primeira série do X2 a ser produzida usando uma técnica de 65 nm. Uma informação importante é que, apesar da redução do espaço ocupado por cada processador (cortesia da nova técnica de fabricação), todos os modelos baseados no Brisbane possuem apenas 512 KB de cache por core. A redução foi feita para aumentar o índice de aproveitamento, já que, como em toda nova técnica de produção, o índice de defeitos é inicialmente muito grande, de forma que produzir processadores menores permite aumentar substancialmente o número de processadores “bons” por wafer, resultando em custos de produção mais baixos.

Uma má notícia é que a AMD aumentou os tempos de latência do cache L2 do Brisbane de 12 para 14 tempos, visando facilitar a produção de futuros modelos com mais cache L2, além de permitir o uso de frequências de clock ligeiramente maiores. Como o Brisbane não inclui melhorias em relação aos modelos anteriores, ele acaba sendo mais lento que um Manchester do mesmo clock (e com a mesma quantidade de cache). Embora a diferença seja pequena (inferior a 2% na maioria dos aplicativos), ela existe.

O Brisbane foi usado em 6 modelos da série Energy Efficient, todos eles com TDP de 65 watts:

Athlon 64 X2 5200+: 2.7 GHz, 2x 512, soquete AM2
Athlon 64 X2 5000+: 2.6 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4800+: 2.5 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4400+: 2.3 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 4000+: 2.1 GHz, 2x 512 KB, soquete AM2
Athlon 64 X2 3600+: 1.9 GHz, 2x 512 KB, soquete AM2

Como de praxe, o uso de um processador dual-core tem seus prós e contras. O principal benefício de usar um processador dual-core é o melhor desempenho ao rodar muitos aplicativos pesados simultaneamente. Se você é do tipo que abre 50 abas do navegador, ouve música, comprime um DVD, retoca imagens no Photoshop ou Gimp para o cartaz que está diagramando no Corel e ainda por cima quer abrir 3 máquinas virtuais do VMware, tudo ao mesmo tempo, um processador dual-core (ou quad-core), acompanhado por 3 ou 4 GB de memória DDR2 ou DDR3, é uma necessidade.

Por outro lado, para usuários que rodam um ou dois aplicativos por vez, que usam o PC predominantemente para jogos (sem executar outras tarefas simultaneamente como, por exemplo, deixar o PC comprimindo um DVD em segundo plano) ou que rodam apenas aplicativos leves, um processador single-core ainda pode ser satisfatório, mesmo nos dias de hoje.

Com a popularização dos processadores dual-core, cada vez mais jogos e outros aplicativos estão ganhando otimizações para o uso de vários núcleos, mas este é um processo vagaroso, já que demanda uma boa dose de trabalho manual.

Comparando um X2 4800+ (2.4 GHz, 2x 1 MB, core Toledo) com um Athlon 64 single-core 4000+ (2.4 GHz, 1 MB, core San Diego) temos o X2 4800+ ganhando por uma margem de 17% no Winstone 2004 (Content Creation), 41% no SYSMark 2004 (3D Content Creation), 1% no Photoshop 7 e 2% no Premiere 6.5 (testes do World Bench 2005), 1% no Doom3 (FPS a 1024×768), 2% no Half Life 2 e 3% no Unreal 2004.

Você pode notar que, com exceção do SYSMark 2004, todos os demais benchmarks e jogos mostram um ganho de desempenho muito inferior ao sugerido pelo aumento de 800 pontos no índice de desempenho da AMD. Isso acontece por que estes testes levam em conta o desempenho ao executar apenas uma tarefa de cada vez. Como disse, um processador dual-core traz benefícios consideráveis apenas ao rodar vários aplicativos simultaneamente.

Rodando um aplicativo por vez, ou rodando apenas benchmarks, existem até casos em que o 4800+ perde para o 4000+ por uma pequena margem (1 ou 2%). É o caso de aplicativos que não conseguem obter nenhum benefício do segundo core e acabam tendo o desempenho penalizado pelo overhead de dividir a carga entre os dois.

Depois do Brisbane, a série Athlon X2 deu espaço ao Phenom, que inaugurou o uso da plataforma K10, com o uso de cache compartilhado e outras melhorias. Apesar disso, a AMD manteve a fabricação dos processadores Athlon X2, que passaram a ser opções de baixo custo.

Entre 2008 e 2009 a série X2 foi atualizada com modelos de 65 nm (core Kuma) e 45 nm (core Regor), mas eles são derivados da arquitetura do Phenom, por isso não conservam muita relação com os modelos originais além do nome comercial. Veremos mais detalhes sobre eles mais adiante, no tópico sobre o Phenom.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X