A arquitetura K8

A arquitetura K8 é usada pelo Athlon 64, Athlon X2 e por outros processadores de 64 bits da AMD anteriores ao Phenom. Além do x86-64, outra melhoria importante foi a inclusão de um circuito de branch-prediction sensivelmente melhorado, com um global history counter 4 vezes maior que o do Athlon K7.

O global history counter é a área reservada a armazenar os resultados de operações processadas anteriormente. Estas informações são utilizadas como base de consulta pelo circuito de branch prediction na hora de decidir qual caminho deve tomar dentro de uma operação de tomada de decisão.

Outro recurso, possivelmente o mais famoso, foi a inclusão do controlador de memória integrado, chamado de IMC (Integrated Memory Controller). Tradicionalmente, o controlador de memória fazia parte do chipset e operava à mesma frequência que ele. O processador se comunicava com o chipset através do Front Side Bus (o barramento principal) e ele (o FSB) era usado para todo o tráfego, incluindo leitura e gravação de dados na memória

Ao mover o controlador de memória para dentro do processador, a AMD foi capaz de reduzir sensivelmente o tempo de latência nos acessos à memória, aumentando assim o desempenho geral do processador. O processador passou a ser ligado diretamente às trilhas da placa-mãe que levam aos módulos de memória, bipassando o chipset.

O Athlon 64 deixou também de usar um barramento frontal para a ligação com o chipset como nos processadores antigos (e nos processadores Intel anteriores ao Core i7) adotando o uso de um link HyperTransport. Para sincronizar a operação dos componentes, passou a ser usado um clock de referência de 200 MHz, que substituiu o clock do FSB, gerando a frequência do processador, da memória e do próprio barramento HyperTransport. No caso de sistemas com dois processadores em SMP (como no caso de servidores equipados com o Opteron), barramentos HyperTransport adicionais fazem a ligação entre os processadores.

Tecnicamente, é incorreto dizer que um Athlon 64 ou um Sempron utilizam “200 MHz de FSB”, já que eles não possuem FSB e os 200 MHz são apenas a frequência de referência. Apesar disso, é muito comum que o termo “FSB” continue a ser usado em exemplos, ou coloquialmente, para descrever o clock da frequência de referência, já que é mais fácil dizer “200 MHz de FSB” do que dizer “clock de referência de 200 MHz” e em seguida explicar o que vem a ser o clock de referência… 🙂

Temos aqui uma foto de divulgação da AMD, mostrando os componentes internos do Athlon 64, onde você pode notar as áreas usadas pelo controlador de memória e pelo barramento HyperTransport:

O HyperTransport é um barramento ponto a ponto, muito similar ao PCI Express sob diversos pontos de vista. A principal ideia é criar um barramento bastante rápido e de baixa latência utilizando poucas trilhas de dados.

Um link HyperTransport é sempre bidirecional, composto por dois links com de 2 a 32 bits de largura cada. Os dados são transmitidos duas vezes por ciclo (como nas memórias DDR) e a frequência de operação pode ser de 800 MHz a 3.2 GHz, de acordo com a implementação. Só para efeito de comparação, o barramento PCI opera a apenas 33 MHz, com uma única transferência por ciclo; isso faz com que a velocidade de transmissão seja muito baixa para os padrões atuais (apenas 133 MB/s), mesmo com o barramento transmitindo 32 bits de dados por ciclo.

O padrão HyperTransport é desenvolvido por um conjunto de fabricantes, por isso é utilizado em diversos dispositivos, indo do Xbox da Microsoft a roteadores da Cisco. Os chipsets nVidia nForce para placas soquete A, por exemplo, já utilizavam o HyperTransport para interligar a ponte norte e a ponte sul do chipset bem antes do Athlon 64 ser lançado.

No caso dos processadores AMD64, são utilizados links com 16 bits de largura em cada direção (16 pares), operando a 800 MHz (nas placas soquete 754) ou 1.0 GHz (nas placas soquete 939, 940 e AM2). Como são realizadas duas transferências por ciclo, podemos dizer também que a frequência efetiva é de (respectivamente) 1.6 GHz e 2.0 GHz

Com 16 bits de largura e operando a 800 MHz com duas transferências por ciclo, temos um total de 6.4 GB/s de transferência de dados (3.2 GB/s em cada direção), o que é uma marca espantosa. Ao aumentar a frequência para 1.0 GHz, a taxa de transmissão sobe para 8 GB/s e, ao atingir 2.0 GHz, a taxa sobe para nada menos do que 16 GB/s.

As placas AM2+ (lançadas em 2008) adotaram o uso do HyperTransport 3.0, capaz de operar a até 2.6 GHz e as AM3 (lançadas em 2009) migraram para o HyperTransport 3.1, que suporta frequências de até 3.2 GHz. Estas expansões não trouxeram ganhos diretos de desempenho, já que apenas aumentaram a banda disponível para a comunicação entre o processador e o chipset, sem influenciar na velocidade dos demais componentes.

Entretanto, elas foram importantes para evitar o aparecimento de gargalos na comunicação, atendendo a casos específicos (como PCs com várias placas 3D, servidores com várias placas de rede gigabit, etc.) além de servirem como um seguro contra o aparecimento de gargalos no futuro, conforme novos dispositivos e barramentos forem sendo incorporados.

Apesar da brutal taxa de transferência, o link HyperTransport é composto por um número relativamente pequeno de trilhas na placa-mãe. Em muitas placas, é possível ver claramente as trilhas do HyperTransport ligando o processador ao chipset:

Trilhas referentes ao barramento HyperTransport interligando o processador
e o chipset em uma placa da Epox

Continuando, temos a questão do gerenciamento de energia. Com exceção do Sempron 2800+, todos os processadores da linha Athlon 64 suportam o Cool’n’Quiet, um sistema de gerenciamento de energia bastante eficiente que, assim como o SpeedStep da Intel e o PowerNow usado pela AMD nos processadores mobile, é capaz de ajustar a frequência de operação do processador de forma dinâmica de acordo com o uso. A principal diferença entre o Cool’n’Quiet e o PowerNow é que ele é otimizado para uso em desktops, de forma que utiliza um sistema menos agressivo de gerenciamento, que tem como prioridade não prejudicar o desempenho.

Um Athlon 64 3500+, por exemplo, pode trabalhar a 2.2 GHz (a frequência normal), 2.0, 1.8 ou 1.0 GHz, de acordo com os aplicativos em uso. Operando na frequência mínima, a tensão do processador cai de 1.4 para 1.1V, gerando uma economia adicional. No final, um 3500+ baseado no core Venice chega a consumir menos de 10 watts quando ocioso, operando na frequência e tensão mínimas.

Como a frequência do processador muda muito rapidamente, de acordo com a demanda (segundo a AMD, até 30 vezes por segundo), você mal percebe a redução de clock. Demora exatamente o mesmo tempo para ripar um DVD, renderizar uma imagem 3D, aplicar um filtro no Photoshop, pois logo que o processador percebe o aumento na demanda de processamento, passa a operar na frequência máxima automaticamente.

As áreas em que você acaba percebendo alguma perda são justamente nas operações mais simples e rápidas, como chavear entre as janelas e abrir menus dentro dos programas. Estas operações são muito rápidas para disparar o aumento na frequência, de forma que, se prestar atenção, você realmente percebe alguma diferença, embora muito pouca.

De uma forma geral, o Cool’n’Quiet (assim como outros sistemas atuais de gerenciamento de energia) acaba sendo um recurso essencial, pois aumenta a vida útil do equipamento (mesmo componentes como o HD e a placa-mãe duram mais ao operar em temperaturas mais baixas, sem falar do cooler, que acumula menos poeira como consequência da baixa rotação e assim precisa de menos manutenção) e gera economia na conta de luz, em troca de uma redução de desempenho muito pequena.

Em um PC com um Athlon 64 3500+, que ficasse ligado continuamente, teríamos uma economia de aproximadamente 30 kW por mês, que equivalem a uma economia anual de mais de 160 reais. Um usuário que montasse um em 2007 e mantivesse o Cool’n’Quiet ativo, teria economizado o suficiente para comprar um Athlon II X4 mais uma placa-mãe nova entre 2007 e 2010.

Para utilizar o Cool’n’Quiet, basta manter o recurso ativado no setup e instalar os drivers da placa. No caso do Linux, o suporte é oferecido através do módulo “powernow-k8” do Kernel e o serviço “powernowd” (instalado através do pacote de mesmo nome). Com os dois componentes disponíveis, a configuração é bem simples, basta carregar o módulo e ativar o serviço, como em:

# modprobe powernow-k8
# /etc/init.d/powernowd start

Você pode acompanhar a oscilação na frequência do processador utilizando um monitor de sistema qualquer. No Linux, você pode utilizar também o comando “cat /proc/cpuinfo”.

Continuando, com o Athlon 64, a AMD voltou a utilizar o heat spreader sobre o núcleo do processador, assim como na época do K6-2. Devido a isso, não é mais possível diferenciar rapidamente as diferentes famílias do Athlon 64 apenas olhando para o tamanho e a posição do núcleo do processador, como na época do Athlon XP:

Athlon 64 e Athlon XP

Assim como o clock do processador, a técnica de produção e a quantidade de cache, o controlador de memória é também usado como um diferencial entre as várias famílias de processadores.

Tudo começou com o Opteron, o primeiro processador baseado na arquitetura Hammer, destinado a servidores. Ele utilizava um controlador de memória dual-channel e oferecia suporte apenas a memórias registered, módulos especiais que incluem um pequeno buffer que estabiliza o sinal, permitindo que sejam utilizados mais módulos na mesma placa-mãe

Os módulos registered são mais caros e mais lentos que os módulos DDR tradicionais que utilizamos em PCs domésticos, mas eles são uma necessidade nos servidores, que precisam utilizar um número muito maior de módulos de memória. Devido ao brutal número de contatos utilizados pelo controlador de memória, o soquete usado pelo Opteron tinha nada menos do que 940 pinos, o que na época era inédito.

A partir do momento em que passou a ser capaz de produzir um volume maior de processadores, a AMD lançou os modelos destinados ao mercado doméstico, que incluem as versões iniciais do Athlon 64 e Athlon 64 FX.

O Athlon 64 FX era uma variação do Opteron, que vinha com 1 MB de cache L2 e mantinha o controlador de memória dual-channel. A grande mudança em relação ao Opteron é que ele passou a oferecer suporte a memórias DDR comuns, o que barateou muito o custo dos micros. Para diferenciar as placas para o Opteron e para o Athlon 64 FX, a AMD criou o soquete 939, que era virtualmente idêntico ao soquete 940 do Opteron. A posição de alguns dos pinos foi alterada apenas para indicar a mudança no tipo de memória suportado e impedir que o Opteron fosse usado nas placas para o Athlon 64 FX e vice-versa. Mais tarde, o soquete 939 foi usado também pelas versões iniciais do Athlon X2.

Em seguida tivemos as versões domésticas do Athlon 64, que vinham com apenas 512 KB de cache L2 e utilizavam um controlador de memória simplificado, sem suporte a dual-channel. Devido ao menor número de contatos utilizados pelo controlador de memória, eles passaram a utilizar o soquete 754.

Athlon 64 FX (soquete 939) e Athlon 64 soquete 754 (à direita)

Soquete 939 (à esquerda) e soquete 754

Considerando dois processadores do mesmo clock, a diferença de desempenho entre um Athlon 64 “normal” e um Athlon 64 FX não era tão grande quanto se poderia imaginar. O controlador de memória dual-channel e o maior cache ajudavam em alguns aplicativos, mas a diferença não era tão grande a ponto de justificar pagar US$ 1000 pelo processador, como chegaram a custar algumas versões do FX.

Se você se assustou com o preço, vale lembrar que as primeiras versões do Athlon 64 FX competiam com o Pentium 4 Extreme Edition; ambos eram processadores “de vitrine”, destinados ao público entusiasta e vendidos a preços exorbitantes. Mais tarde, foram lançadas versões do Athlon 64 soquete 754 com 1 MB de cache L2, que praticamente anularam as vantagens do FX, que no devido tempo acabou sendo descontinuado.

Tanto os processadores soquete 754 quanto os 939 e 940 utilizavam memórias DDR, que logo começaram a se tornar antiquadas. Em 2006 a AMD iniciou a migração para o soquete AM2 que, em conjunto com mudanças no controlador de memória dos processadores, introduziu o suporte a módulos DDR2. Apesar de também possuir 940 contatos, o soquete AM2 é incompatível com o soquete 940 utilizado pelo Opteron, além de ser incompatível com todos os processadores anteriores.

Os módulos de memória DDR2 utilizam 240 contatos (contra apenas 184 dos módulos DDR) e com o controlador de memória integrado, os contatos vão diretamente para o processador, através de pinos no soquete. Apesar disso, a AMD conseguiu fazer a migração das memórias DDR para as DDR2 sem aumentar o número de pinos do soquete, remanejando uma série de contatos sem uso no processador.

Apesar do ganho de desempenho não ser tão grande quanto poderia parecer à primeira vista, as memórias DDR2 oferecem a vantagem de trabalharem utilizando uma tensão mais baixa: apenas 1.8V, contra 2.5V das memórias DDR. Isto faz com que tanto os módulos de memória quanto o próprio controlador de memória integrado ao processador consumam menos energia (e dissipem menos calor), o que ajuda na questão da refrigeração.

Embora fossem mais caras no início, as memórias DDR2 logo passaram a ser produzidas em maior quantidade e utilizando técnicas mais modernas de fabricação, o que fez com que a capacidade dos módulos aumentasse e os preços caíssem rapidamente. A AMD acertou no tempo da migração, fazendo a transição quase exatamente no momento em que as DDR2 começaram a ser vendidas mais barato que as DDR.

Com a migração, as placas soquete 754 ficaram inicialmente relegadas à posição de plataforma de baixo custo (como sempre, houve uma grande oferta de placas antigas a preços baixos) e no devido curso do tempo foram completamente substituídas. A partir da segunda metade de 2006, até mesmo os Semprons passaram a ser fabricados em versão AM2.

O AM2 trouxe também um novo suporte de retenção do cooler (a “gaiola” em volta do processador). Ele é preso à placa-mãe por quatro parafusos (em vez de apenas dois), o que tornou o mecanismo de retenção mais firme. O problema é que ele passou a usar um formato octagonal (ao invés do formato quadrado usado no soquete 754 e 939), o que quebrou a compatibilidade com grande parte dos coolers antigos.

Detalhe do suporte de retenção (AM2 acima) e um cooler AM2 boxed da AMD

Visualmente, o soquete AM2 é praticamente idêntico ao soquete 939, mudando apenas a posição de alguns dos pinos. O contato adicional pode ser visto no canto inferior direito do soquete:

Soquete AM2, com o pino adicional em destaque

Em 2007 o soquete AM2 foi atualizado, dando origem ao AM2+, que continua em uso até os dias de hoje. O AM2+ manteve a mesma pinagem do AM2 (preservando a compatibilidade com os processadores antigos) e trouxe duas melhorias: o suporte ao HyperTransport 3.0 (com frequências de até 2.6 GHz) e suporte a split power planes, um recurso de gerenciamento avançado de energia introduzido a partir do Phenom, que permite que os núcleos do processador e o controlador de memória utilizem tensões diferentes, reduzindo o consumo.

A principal desvantagem de utilizar o controlador de memória integrado, é que passou a ser necessário lançar uma versão atualizada do processador e criar um novo soquete cada vez que é preciso fazer alterações no controlador de memória, ou oferecer suporte a uma nova tecnologia. Isso levou à introdução do soquete AM3 em fevereiro 2009, que trouxe o suporte a memórias DDR3.

Embora o formato do soquete tenha continuado o mesmo e a pinagem seja similar, o AM3 utiliza três pinos a menos, o que faz com que o soquete obstrua o encaixe de processadores AM2 ou AM2+, que suportam apenas memórias DDR2.

Por outro lado, processadores AM3 da safra atual (como as versões AM3 do Phenom II e do Athlon II), utilizam um controlador de memória híbrido, que oferece suporte simultâneo a memórias DDR2 e DDR3. Isso permite que eles sejam usados tanto em conjunto com placas AM3 quanto em conjunto com placas AM2+ (e até mesmo em conjunto com algumas placas AM2 antigas), embora com um desempenho levemente inferior, devido ao barramento mais estreito com a memória. Veremos mais detalhes sobre ele no tópico sobre o Phenom II.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X