Athlon 64 X2

O Athlon 64 X2 é a versão dual-core do Athlon 64. Quando ele foi lançado, em 2005, a Intel ainda se debatia com a plataforma NetBurst, produzindo primariamente o Pentium D, que era um processador dual-chip (em que temos dois processadores separados, dentro do mesmo encapsulamento) e não um processador dual-core “de verdade”. No Pentium D, os dois cores comunicam-se entre si e com o chipset, utilizando o FSB, um barramento relativamente lento para acumular as duas funções.

No caso do Athlon X2, temos os dois núcleos construídos sobre o mesmo wafer. A comunicação entre os dois núcleos é feita internamente, utilizando um barramento interno, batizado de SRI (System Request Interface), o que garante tempos de latência mais baixos e pequenos ganhos de desempenho ao rodar muitos aplicativos simultaneamente (que é justamente a área em que os processadores dual-core oferecem mais vantagens), além de permitir que o processador seja capaz de operar a freqüências um pouco mais elevadas.

Na camada mais externa, temos o “Crossbar Switch”, responsável por dividir as requisições entre os dois cores, controlar o acesso de ambos ao controlador de memória (e ao barramento HyperTransport), além de monitorar o nível de carregamento de cada um, informação utilizada, entre outras coisas, pelo sistema de gerenciamento de energia. Este diagrama da AMD mostra o conceito:


Diagrama de blocos do X2

Cada processador possui seu próprio cache L2, mas ambos compartilham o mesmo controlador de memória e o mesmo barramento HyperTransport, através do qual é feita toda a comunicação com o chipset e os demais componentes do PC. Olhando uma foto ampliada do processador, você pode notar que os dois núcleos ficam no centro, envoltos pelos circuitos referentes ao controlador de memória e HyperTransport. Além dos circuitos compartilhados, os dois núcleos também não são exatamente cópias idênticas um do outro:


Athlon 64 X2

O uso de dois núcleos torna o processador mais dependente do barramento com a memória. Devido a isso, o Athlon 64 X2 foi lançado apenas em versões soquete 939 e AM2 (futuramente serão lançadas também versões AM2+ e AM3), já que uma versão soquete 754 seria penalizada pelo barramento single-channel. O lançamento do Athlon X2 acelerou a migração para as placas soquete 939, transformando a plataforma 754 em uma opção de baixo custo, destinada ao Sempron e às versões mais lentas do Athlon 64.

Ao contrário do que teríamos ao utilizar dois processadores separados em SMP, um processador dual-core atual, como o Athlon X2, Pentium D ou Core 2 Duo não consomem o dobro de energia que as versões single-core. Isto é possível graças a sistemas de gerenciamento de energia incluídos no processador, que reduzem a freqüência ou mesmo desativam completamente o segundo núcleo quando o processador está ocioso. No caso do Athlon X2, muitos componentes são compartilhados entre os dois processadores, o que aumenta a economia.

Se comparado com um Athlon 64 4000+ com core San Diego (que também opera a 2.4 GHz), um Athlon X2 4800+ Toledo (2.4 GHz, 1 MB) consome cerca de 12 watts a mais enquanto o sistema está ocioso e 24 watts a mais ao rodar um benchmark. Considerando que o TDP do San Diego é de 89 watts, o aumento não é tão significativo.

Um aplicativo que conseguisse utilizar simultaneamente todo o processamento de ambos os cores poderia, em teoria, fazer com que o consumo chegasse a ser, momentaneamente, próximo do dobro, mas em situações reais isto não acontece com freqüência.

A carreira do X2 começa com o core Manchester, lançado em maio de 2005. Ele era fabricado usando uma técnica de 0.09 micron, com 512 KB de cache L2 por core (1 MB no total) e suporte às instruções SS3. A versão mais lenta tinha metade do cache L2 desabilitado, de forma a aproveitar os cores com defeitos no cache.

O Manchester foi usado nos Athlon 64 X2 3600+ (2.0 GHz, 2x 256 KB, soquete 939), 3800+ (2.0 GHz, 2x 512 KB, soquete 939), 4200+ (2.2 GHz, 2x 512 KB, soquete 939) e 4600+ (2.4 GHz, 2x 512 KB, soquete 939)

O seguinte foi o core Toledo, ainda fabricado em uma técnica de 0.09 micron, mas agora com 1 MB de cache por core, totalizando 2 MB. Ele foi lançado simultaneamente com o Manchester, e os modelos do X2 baseados em ambos conviveram durante mais de um ano. Apenas três dos modelos produzidos utilizando o core Toledo vieram com todo o cache ativo. O demais vinham com metade do cache desativado, o que os tornava praticamente indistinguíveis dos baseados no Manchester.

O Toledo foi utilizado nos modelos 3800+ (2.0 GHz, 2x 512 KB, soquete 939), 4200+ (2.2 GHz, 2x 512 KB, soquete 939), 4400+ (2.2 GHz, 2x 1 MB, soquete 939), 4600+ (2.4 GHz, 2x 512 KB, soquete 939) e 4800+ (2.4 GHz, 2x 1 MB, soquete 939).

Quase um ano depois, em maio de 2006, foi lançado o Windsor, que passou a utilizar o soquete AM2 e adicionou suporte ao AMD-V, mantendo a mesma técnica de produção de 0.09 micron e o uso de 2x 1 MB de cache. Assim como no Toledo, uma grande parte dos modelos vinham com metade do cache L2 desabilitado e eram vendidos sob índices de desempenho mais baixos que os “completos”.

O Windsor foi utilizado nos modelos 3800+ (2.0 GHz, 2x 512 KB, soquete AM2), 4000+ (2.0 GHz, 2x 1 MB, soquete AM2), 4200+ (2.2 GHz, 2x 512 KB, soquete AM2), 4400+ (2.2 GHz, 2x 1 MB, soque AM2), 4600+ (2.4 GHz, 2x 512 KB, soquete AM2), 5000+ (2.6 GHz, 2x 512 KB, soquete AM2), 5200+ (2.6 GHz, 2x 1 MB, soquete AM2), 5400+ (2.8 GHz, 2x 512 KB, soquete AM2), 5600+ (2.8 GHz, 2x 1 MB, soquete AM2) e 6000+ (3.0 GHz, 2x 1 MB, soquete AM2).

Todos os modelos baseados no core Windsor possuem um TDP de 89 watts, assim como a maior parte das versões baseadas nos cores Manchester e Toledo. A exceção fica por conta do 6000+, que apesar da diferença de apenas 200 MHz em relação ao 5600+, possui um TDP de 125 watts. Esta diferença tão grande é causada pelo gate leakage, o mesmo problema que a Intel enfrentou com o Pentium 4 ao cruzar a barreira dos 3.0 GHz e que às vezes enfrentamos ao fazer overclocks agressivos.

A partir de uma certa freqüência (que varia de acordo com a arquitetura), os transístores passam a desperdiçar cada vez mais energia, de forma que é necessário utilizar uma tensão cada vez mais alta para estabilizar o processador (aumento que aumenta ainda mais o desperdício de energia), criando um ciclo vicioso que se intensifica a cada novo aumento de freqüência. O 6000+ é basicamente uma versão overclocada do 5600+, onde a tensão foi aumentada de 1.30 para 1.35v para estabilizar o processador. Ele é um modelo que deve ser evitado na hora da compra.

Como uma opção para quem prefere um processador mais econômico e frio, a AMD lançou a série “Energy Efficient“, onde são usadas técnicas derivadas dos processadores mobile, como o uso de tensões mais baixas e de transístores de chaveamento mais lento, que resultam em processadores com um consumo mais baixo, mas que em compensação não são capazes de atingir freqüências de operação tão altas quanto os das séries principais.

A série Energy Efficient do Windsor, por exemplo, abrange modelos do 3600+ (2.0 GHz, 2x 1MB, soquete AM2) ao 5200+ (2.6 GHz, 2x 1MB, soquete AM2), todos com tensão de 1.2v e TDP de 65 watts. Eles são mais caros que os da série regular, com o preço variando de acordo com o clock (nas freqüências mais altas, a diferença pode ser de mais de 200 reais, enquanto nos modelos populares pode cair para menos de 30).

De uma forma geral, os modelos Energy Efficiency valem a pena em casos em que a diferença de preço é pequena, pois a economia de energia acaba se pagando com o passar do tempo. Em um PC que fica ligado continuamente, uma economia de 24 watts acaba resultando em uma redução de mais de 200 reais na conta de luz ao longo de dois anos.

Por último, temos o Brisbane, a primeira série do X2 a ser produzida usando uma técnica de 0.065 micron. Uma informação importante é que, apesar da redução do espaço ocupado por cada processador (cortesia da nova técnica de fabricação) todos os modelos baseados no Brisbane possuem apenas 512 KB de cache por core. A redução foi feita para aumentar o índice de aproveitamento, já que, como em toda nova técnica de produção, o índice de defeitos é inicialmente muito grande, de forma que produzir processadores menores permite aumentar substancialmente o número de processadores “bons” por wafer.

Uma má notícia é que a AMD aumentou os tempos de latência do cache L2 do Brisbane de 12 para 14 tempos, visando facilitar a produção de futuros modelos com mais cache L2, além de permitir o uso de freqüências de clock ligeiramente maiores. Como o Brisbane não inclui melhorias em relação aos modelos anteriores, ele acaba sendo mais lento que um Manchester do mesmo clock (e com a mesma quantidade de cache). Embora a diferença seja pequena, inferior a 2% na maioria dos aplicativos, ela existe.

O Brisbane foi usado em 6 modelos da série Energy Efficient, todos eles com TDP de 65 watts: 3600+ (1.9 GHz, 2x 512 KB, soquete AM2), 4000+ (2.1 GHz, 2x 512 KB, soquete AM2), 4400+ (2.3 GHz, 2x 512 KB, soquete AM2), 4800+ (2.5 GHz, 2x 512 KB, soquete AM2), 5000+ (2.6 GHz, 2x 512 KB, soquete AM2) e 5200+ (2.7 GHz, 2x 512, soquete AM2).

Como de praxe, o uso de um processador dual-core tem seus prós e contras. O principal benefício de usar um processador dual-core é o melhor desempenho ao rodar muitos aplicativos pesados simultaneamente. Se você é do tipo que abre 50 abas do navegador, ouve música, comprime um DVD, retoca imagens no Photoshop (ou Gimp 😉 para o cartaz que está diagramando no Corel e ainda por cima quer abrir 3 máquinas virtuais do VMware, tudo ao mesmo tempo, um processador dual-core, acompanhado por 2 ou 4 GB de memória DDR2 (ou DDR3), é uma necessidade.

Por outro lado, para usuários que rodam um ou dois aplicativos por vez, que usam o PC predominantemente para games (sem executar outras tarefas simultaneamente como, por exemplo, deixar o PC comprimindo um DVD em segundo plano) ou que rodam apenas aplicativos leves, um processador single-core mais barato, ou com uma freqüência ligeiramente maior ofereceria uma relação custo-benefício melhor.

Comparando um X2 4800+ (2.4 GHz, 2x 1 MB, core Toledo) com um Athlon 64 single-core 4000+ (2.4 GHz, 1 MB, core San Diego) temos o X2 4800+ ganhando por uma margem de 17% no Winstone 2004 (Content Creation), 41% no SYSMark 2004 (3D Content Creation), 1% no Photoshop 7 e 2% no Premiere 6.5 (testes do World Bench 2005), 1% no Doom3 (FPS a 1024×768), 2% no Half Life 2 e 3% no Unreal 2004.

Você pode notar que, com exceção do SYSMark 2004, todos os demais benchmarks e games mostram um ganho de desempenho muito inferior ao sugerido pelo aumento de 800 pontos no índice de desempenho da AMD. Isso acontece por que estes testes levam em conta o desempenho ao executar apenas uma tarefa de cada vez. Como disse, um processador dual-core traz benefícios consideráveis apenas ao rodar vários aplicativos simultaneamente.

Rodando um aplicativo por vez, ou rodando apenas benchmarks, existem até casos em que o 4800+ perde do 4000+ por uma pequena margem (1 ou 2%). É o caso de aplicativos que não conseguem obter nenhum benefício do segundo core e acabam tendo o desempenho penalizado pelo overhead de dividir a carga entre os dois.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X