Arquitetura da GPU

A GPU do Trinity é uma versão reduzida da Cayman, parte da família Northern Islands (Radeon HD 6xxx). Assim como as outras GPUs da família, ela implementa um design VLIW 4, em vez do design VLIW 5 das antecessoras, sendo equipada com 6 módulos SIMD, cada um composto por 16 núcleos VLIW 4, em um total de 384 unidades de processamento.

Como você deve lembrar, o Llano oferece 400 unidades de processamento, o que pode fazer as 384 unidades do Trinity soarem como um retrocesso. É neste ponto em que a arquitetura VLIW 4 apresenta seu lado positivo. A questão central é, contrariando a aposta inicial da AMD, a quinta unidade de cada array VLIW 5 das GPUs anteriores acabava sendo raramente usada pelos aplicativos, fazendo com que ela acabasse sendo um desperdício de recursos. Como resultado, o Llano tinha 400 unidades, mas apenas 320 delas eram usadas na maior parte do tempo. No Trinity a quinta unidade é eliminada em favor do uso de mais módulos. Como resultado, temos apenas 384 unidades, mas todas são realmente usadas, fazendo com que no final das contas o trabalho executado pela GPU seja maior.

A GPU inclui também 24 unidades de processamento de texturas e 8 ROPs, o que a torna praticamente uma redução 1/4 exata da Radeon HD 6970. Infelizmente as frequências de operação são mais baixas, com a GPU operando a 497 MHz por default (contra os 444 MHz do Llano), que podem subir para até 686 MHz com o turbo. Este slide da AMD inclui o diagrama de blocos da GPU:

Seguindo os passos da Intel, a AMD está usando a GPU para diferenciar diferentes linhas de produtos. As APUs da linha A10 são vendidas com a GPU completa, com todas as 384 unidades operacionais, enquanto as da linha A8 recebem apenas 256 unidades e as da linha A6 apenas 192. Como de praxe, a AMD está inicialmente desativando seletivamente unidades não-funcionais em processadores com imperfeições de fabricação para as linhas A6 e A8, mas é provável que em algum momento introduzam uma versão reduzida do chip, que seja mais barata de produzir.

Desenvolver GPUs integradas de alto desempenho continua sendo uma tarefa difícil, já que além da limitação em relação ao barramento com a memória, temos também limitações em relação ao consumo (os modelos destinados a notebooks precisam operar dentro de um TDP de 35 watts ou menos, que inclui tanto o consumo do processador quanto da GPU) e em relação ao espaço ocupado dentro do die, já que uma APU com uma área muito grande seria muito cara de se produzir. Considerando as limitações, podemos apreciar o que a AMD conseguiu fazer no Trinity.

Com a migração para os módulos Piledriver, a proporção de transístores investidos na GPU se tornou ainda dramática, com a GPU ocupando agora uma área maior que todos os outros componentes somados. Na imagem a seguir, podemos distinguir os dois núcleos Piledriver (à esquerda) e o retângulo referente ao controlador de memória (topo superior esquerdo), bem como alguns outros componentes menores (linhas PCIe, HDMI, etc.) na parte inferior. Todo o restante é ocupado pela GPU:

O Trinity é composto por 1.3 bilhões de transístores e ocupa uma área de 246 mm² (contra os 1.18 bilhões e 228 mm² do Llano). Como ambos os processadores são produzidos em uma técnica de 32 nm, a AMD foi forçada a enxugar a torneira com o Trinity, encontrando formas de melhorar o desempenho sem que o processador crescesse muito. 

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X