Entendendo a arquitetura K8

Dentro da linha de processadores da AMD, as três principais famílias são a arquitetura K6, usada nos antigos processadores K6-2 e K6-3, a arquitetura K7, usada nos Athlons, Durons e Semprons de 32 bits e, finalmente, a arquitetura K8, que é usada nos processadores de 64 bits.

Além do x86-64, a arquitetura K8, inclui um circuito de branch-prediction sensivelmente melhorado, com um global history counter 4 vezes maior que o do Athlon K7. O global history counter é a área reservada a armazenar os resultados de operações processadas anteriormente. Estas informações são utilizadas como base de consulta pelo circuito de branch prediction na hora de decidir qual caminho deve tomar dentro de uma operação de tomada de decisão.

Outro recurso, possivelmente o mais famoso, é o controlador de memória integrado, chamado de IMC (Integrated Memory Controller). Tradicionalmente, o controlador de memória faz parte do chipset e opera à mesma freqüência que ele. O processador se comunica com o chipset através do Front Side Bus (o barramento principal) e ele (o FSB) é utilizado para todo o tráfego, incluindo a leitura e gravação de dados na memória

Ao mover o controlador de memória para dentro do processador, a AMD foi capaz de reduzir sensivelmente o tempo de latência nos acessos à memória, aumentando assim o desempenho do processador em alguns pontos. Nos processadores baseados na arquitetura K8, o processador é ligado diretamente às trilhas da placa-mãe que levam aos pentes de memória, e a comunicação com o chipset é feita através de um barramento HyperTransport. No caso de sistemas com dois processadores em SMP (como no caso de servidores equipados com o Opteron), barramentos HyperTransport adicionais fazem a ligação entre os processadores.

O Athlon 64 não utiliza mais um barramento frontal, como nos processadores antigos, mas sim um link HyperTransport que liga o processador ao chipset. Existe um clock de referência de 200 MHz, que substitui o FSB, gerando a freqüência do processador, da memória e do próprio barramento HyperTransport. Tecnicamente, seria incorreto dizer que um Athlon 64 ou Sempron utiliza “200 MHz de FSB”, já que ele não possui FSB e os 200 MHz são apenas a freqüência de referência, mas para manter as coisas simples, vou continuar usando o termo “FSB” para descrever o clock da freqüência de referência daqui em diante.

O HyperTransport é um barramento ponto a ponto, muito similar ao PCI Express sob diversos pontos de vista. A principal idéia é criar um barramento bastante rápido e de baixa latência utilizando poucas trilhas de dados.

Um link HyperTransport é sempre bidirecional, composto por dois links com de 2 a 32 bits de largura cada. Os dados são transmitidos duas vezes por ciclo (como nas memórias DDR) e a freqüência de operação pode ser de 200 MHz a 2.6 GHz. Só para efeito de comparação, o barramento PCI opera a apenas 33 MHz, com apenas uma transferência por ciclo; isso faz com que a velocidade de transmissão seja muito baixa para os padrões atuais (apenas 133 MB/s), mesmo com o barramento transmitindo 32 bits de dados por ciclo.

O padrão HyperTransport é desenvolvido por um conjunto de fabricantes, por isso é utilizado em diversos dispositivos, indo do Xbox da Microsoft a roteadores da Cisco. Os chipsets nForce, para placas soquete A, por exemplo, já utilizavam o HyperTransport para interligar a ponte norte e a ponte sul do chipset bem antes do Athlon 64 ser lançado.

No caso dos processadores AMD64, são utilizados links com 16 bits de largura em cada direção (16 pares), operando a 800 MHz (nas placas soquete 754) ou 1.0 GHz (nas placas soquete 939, 940 e AM2). Como são realizadas duas transferências por ciclo, podemos dizer também que a freqüência “efetiva” é de (respectivamente) 1.6 GHz e 2.0 GHz.

Apesar da brutal taxa de transferência, o link HyperTransport é composto por um número relativamente pequeno de trilhas na placa-mãe. Em muitas placas, é possível ver claramente as trilhas do HyperTransport ligando o processador ao chipset:

Continuando, temos a questão do gerenciamento de energia. Com exceção do Sempron 2800+, todos os processadores da linha Athlon 64 suportam o Cool’n’Quiet, um sistema de gerenciamento de energia bastante eficiente que, assim como o SpeedStep da Intel e o PowerNow usado pela AMD nos processadores mobile, é capaz de ajustar a freqüência de operação do processador de forma dinâmica de acordo com o uso. A principal diferença entre o Cool’n’Quiet e o PowerNow é que ele é otimizado para uso em desktops, de forma que utiliza um sistema menos agressivo de gerenciamento, que tem como prioridade não prejudicar o desempenho.

Um Athlon 64 3500+, por exemplo, pode trabalhar a 2.2 GHz (a freqüência normal), 2.0, 1.8 ou 1.0 GHz, de acordo com os aplicativos em uso. Operando na freqüência mínima, a tensão do processador cai de 1.4 para 1.1V, gerando uma economia adicional. No final, um Athlon 64, baseado no core Venice, ou mais atual, chega a consumir menos de 10 watts quando ocioso, operando na freqüência e tensão mínimas.

Como a freqüência do processador muda muito rapidamente, de acordo com a demanda (segundo a AMD, até 30 vezes por segundo), você mal percebe a redução de clock. Demora exatamente o mesmo tempo para ripar um DVD, renderizar uma imagem 3D, aplicar um filtro no Photoshop, pois logo que o processador percebe o aumento na demanda de processamento, passa a operar na freqüência máxima automaticamente.

As áreas em que você acaba percebendo alguma perda são justamente nas operações mais simples e rápidas, como chavear entre as janelas e abrir menus dentro dos programas. Estas operações são muito rápidas para disparar o aumento na freqüência, de forma que, se prestar atenção, você realmente percebe alguma diferença, embora muito pouco

» Leia mais: A arquitetura K8

Ver Mais

Esta postagem foi modificada pela última vez em 23/03/2011 14:33

Postagem relacionada