Entendendo a arquitetura K8

A arquitetura K8 é usada pelo Athlon 64, Athlon X2 e por outros processadores de 64 bits da AMD anteriores ao Phenom. Além do x86-64, outra melhoria importante foi a inclusão de um circuito de branch-prediction sensivelmente melhorado, com um global history counter 4 vezes maior que o do Athlon K7.

O global history counter é a área reservada a armazenar os resultados de operações processadas anteriormente. Estas informações são utilizadas como base de consulta pelo circuito de branch prediction na hora de decidir qual caminho deve tomar dentro de uma operação de tomada de decisão.

Outro recurso, possivelmente o mais famoso, foi a inclusão do controlador de memória integrado, chamado de IMC (Integrated Memory Controller). Tradicionalmente, o controlador de memória fazia parte do chipset e operava à mesma frequência que ele. O processador se comunicava com o chipset através do Front Side Bus (o barramento principal) e ele (o FSB) era usado para todo o tráfego, incluindo a leitura e gravação de dados na memória

Ao mover o controlador de memória para dentro do processador, a AMD foi capaz de reduzir sensivelmente o tempo de latência nos acessos à memória, aumentando assim o desempenho geral do processador. O processador passou a ser ligado diretamente às trilhas da placa-mãe que levam aos pentes de memória.

O Athlon 64 deixou também de usar um barramento frontal para a ligação com o chipset como nos processadores antigos (e nos processadores Intel anteriores ao Core i7) adotando o uso de um link HyperTransport. Para sincronizar a operação dos componentes, passou a ser usado um clock de referência de 200 MHz, que substituiu o clock do FSB, gerando a frequência do processador, da memória e do próprio barramento HyperTransport. No caso de sistemas com dois processadores em SMP (como no caso de servidores equipados com o Opteron), barramentos HyperTransport adicionais fazem a ligação entre os processadores.

Temos aqui uma foto de divulgação da AMD, mostrando os componentes internos do Athlon 64, onde você pode notar as áreas usadas pelo controlador de memória e pelo barramento HyperTransport:

7f07ea0a

O HyperTransport é um barramento ponto a ponto, muito similar ao PCI Express sob diversos pontos de vista. A principal ideia é criar um barramento bastante rápido e de baixa latência utilizando poucas trilhas de dados.

Um link HyperTransport é sempre bidirecional, composto por dois links com de 2 a 32 bits de largura cada. Os dados são transmitidos duas vezes por ciclo (como nas memórias DDR) e a frequência de operação pode ser de 800 MHz a 3.2 GHz, de acordo com a implementação. Só para efeito de comparação, o barramento PCI opera a apenas 33 MHz, com apenas uma transferência por ciclo; isso faz com que a velocidade de transmissão seja muito baixa para os padrões atuais (apenas 133 MB/s), mesmo com o barramento transmitindo 32 bits de dados por ciclo.

O padrão HyperTransport é desenvolvido por um conjunto de fabricantes, por isso é utilizado em diversos dispositivos, indo do Xbox da Microsoft a roteadores da Cisco. Os chipsets nForce, para placas soquete A, por exemplo, já utilizavam o HyperTransport para interligar a ponte norte e a ponte sul do chipset bem antes do Athlon 64 ser lançado.

No caso dos processadores AMD64, são utilizados links com 16 bits de largura em cada direção (16 pares), operando a 800 MHz (nas placas soquete 754) ou 1.0 GHz (nas placas soquete 939, 940 e AM2). Como são realizadas duas transferências por ciclo, podemos dizer também que a frequência efetiva é de (respectivamente) 1.6 GHz e 2.0 GHz

Com 16 bits de largura e operando a 800 MHz, com duas transferências por ciclo, temos um total de 6.4 GB/s de transferência de dados (3.2 GB/s em cada direção), o que é uma marca espantosa. Ao aumentar a frequência para 1.0 GHz, a taxa de transmissão sobe para 8 GB/s e, ao atingir 2.0 GHz, a taxa sobe para nada menos do que 16 GB/s.

Apesar da brutal taxa de transferência, o link HyperTransport é composto por um número relativamente pequeno de trilhas na placa-mãe. Em muitas placas, é possível ver claramente as trilhas do HyperTransport ligando o processador ao chipset:

2ca0a8c2

Continuando, temos a questão do gerenciamento de energia. Com exceção do Sempron 2800+, todos os processadores da linha Athlon 64 suportam o Cool’n’Quiet, um sistema de gerenciamento de energia bastante eficiente que, assim como o SpeedStep da Intel e o PowerNow usado pela AMD nos processadores mobile, é capaz de ajustar a frequência de operação do processador de forma dinâmica de acordo com o uso. A principal diferença entre o Cool’n’Quiet e o PowerNow é que ele é otimizado para uso em desktops, de forma que utiliza um sistema menos agressivo de gerenciamento, que tem como prioridade não prejudicar o desempenho.

Um Athlon 64 3500+, por exemplo, pode trabalhar a 2.2 GHz (a frequência normal), 2.0, 1.8 ou 1.0 GHz, de acordo com os aplicativos em uso. Operando na frequência mínima, a tensão do processador cai de 1.4 para 1.1V, gerando uma economia adicional. No final, um 3500+ baseado no core Venice chega a consumir menos de 10 watts quando ocioso, operando na frequência e tensão mínimas.

Como a frequência do processador muda muito rapidamente, de acordo com a demanda (segundo a AMD, até 30 vezes por segundo), você mal percebe a redução de clock. Demora exatamente o mesmo tempo para ripar um DVD, renderizar uma imagem 3D, aplicar um filtro no Photoshop, pois logo que o processador percebe o aumento na demanda de processamento, passa a operar na frequência máxima automaticamente.

As áreas em que você acaba percebendo alguma perda são justamente nas operações mais simples e rápidas, como chavear entre as janelas e abrir menus dentro dos programas. Estas operações são muito rápidas para disparar o aumento na frequência, de forma que, se prestar atenção, você realmente percebe alguma diferença, embora muito pouco.

De uma forma geral, o Cool’n’Quiet (assim como outros sistemas atuais de gerenciamento de energia) acaba sendo um recurso essencial, pois aumenta a vida útil do equipamento (mesmo componentes como o HD e a placa-mãe duram mais ao operar em temperaturas mais baixas, sem falar do cooler, que acumula menos poeira e assim precisa de menos manutenção) e gera economia na conta de luz, em troca de uma redução de desempenho muito pequena.

Com o passar dos meses, a economia pode somar um valor significativo. Em um PC com um Athlon 64 3500+ que ficasse ligado continuamente, teríamos uma economia de aproximadamente 30 kW por mês, que em dois anos equivalem a uma economia de mais de R$ 350 na conta de luz, suficientes para pagar uma placa 3D nova.

Com o Athlon 64, a AMD voltou a utilizar o heat spreader sobre o núcleo do processador, assim como na época do K6-2. Devido a isso, não é mais possível diferenciar rapidamente as diferentes famílias do Athlon 64 apenas olhando para o tamanho e a posição do núcleo do processador, como na época do Athlon XP:

5e04f713

Assim como o clock do processador, a técnica de produção e a quantidade de cache, o controlador de memória é também usado como um diferencial entre as diferentes famílias de processadores.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X