O G70 não inclui nenhuma grande novidade em relação ao NV40. Ele é mais rápido, por incluir mais unidades de processamento e ser capaz de operar a freqüências um pouco mais altas, mas a arquitetura é basicamente a mesma.
O G80, por sua vez, é baseado em uma arquitetura bem diferente, com o uso de unidades shader unificadas, chamadas de “stream processors”, que são basicamente unidades de ponto flutuante programáveis, que podem ser usados como unidades de pixel shader, unidades vertex shader ou ainda desempenhar outras funções, de acordo com a demanda. O G80 é também compatível com o DirectX 10 (o G70 é compatível com o 9.0c) e com o Shader Model 4.0, o que representa uma garantia de compatibilidade com os jogos lançados no futuro.
A vantagem de utilizar os stream processors no lugar das unidades shader dedicadas é que eles podem absorver melhor a variação na demanda por processamento de pixel shaders ou de vertex shaders por parte do aplicativo, sem gargalos. A desvantagem é que os stream processors são um pouco menos eficientes do que unidades dedicadas, por isso o G80 inclui um número muito maior deles.
Enquanto o G70 inclui 24 unidades de pixel shader e 8 unidades de vertex shader (32 no total), o G80 utiliza um conjunto de 8 clusters, com 16 unidades unificadas cada um, totalizando 128 stream processors. Dentro das unidades, as ALUs (os circuitos responsáveis pelo processamento das instruções) operam a uma freqüência maior que o restante do chip (o dobro ou mais), o que representa uma melhoria importante. Com isso, a GPU da 8800 GTX, por exemplo, trabalha a 575 MHz, mas as unidades de processamento trabalham a 1.35 GHz, o que resulta em um aumento expressivo no volume de dados processados.
Na prática, é incorreto dizer que o G80 possui “128 unidades de shader unificadas”, já que cada cluster se comparta como uma única unidade. Tecnicamente, o G80 possui apenas 8 unidades shader unificadas, embora elas sejam muito maiores e executem muito mais processamento do que as mais numerosas unidades dedicadas do G70. Isso explica o fato do G80 possuir apenas 6 ROPs (contra os 16 do G70). Embora em menor número, os ROPs do G80 são muito mais “largos”, executando muito mais processamento por ciclo de clock do que os do G70.
O chip inclui ainda pequenas porções de cache, dentro de cada cluster e também dentro dos ROPs, que armazenam tanto instruções quanto texturas que estão sendo processadas. Os caches possuem uma função muito similar aos caches usados nos processadores, embora a eficiência seja mais limitada, devido ao tipo de processamento executado pela placa de vídeo.
Diagrama de blocos do G80
Naturalmente, um número tão grande de unidades de processamento resultaram em um chip bastante complexo (e caro de produzir), com nada menos do que 686 milhões de transístores. O aumento nas unidades de processamento foi acompanhado por um aumento também no barramento com a memória, que passou a ser de 384 bits (dividido em 6 canais independentes, de 64 bits cada).
O G80 original é usado na GeForce 8800 GTX (768 MB, GPU a 575 MHz – com as unidades de processamento a 1.35 GHz – e memória GDDR3 a 1.8 GHz) e na GeForce 8800 Ultra (768 MB, GPU a 612 MHz – com as unidades de processamento a 1.5 GHz – e memória GDDR3 a 2.16 GHz). A 8800 GTS (320 ou 640 MB, GPU a 500 MHz – com as unidades de processamento a a 1.2 GHz – e memória GDDR3 a 1.6 GHz) é baseada em uma versão castrada do chip, com duas das unidades shader unificadas desativadas e um barramento com a memória de apenas 320 bits. Como de praxe, o G80 foi seguido por duas versões de baixo custo, o G84 e o G86.
O G84 é uma versão reduzida do G80, usado nas GeForce 8600 GTS. Ele é produzido usando a mesma técnica de 80 nanômetros, mas possui apenas 2 unidades shader unificadas (ou seja, 32 stream processors), o que resulta (a 675 MHz) em um fill rate de 10800 megatexels. Como de praxe, o barramento com a memória também foi reduzido, para apenas 128 bits.
O G84 é usado na GeForce 8600 GT (256 MB, GPU a 540 MHz – com as unidades de processamento a 1.18 GHz – e memória GDDR3 a 1.4 GHz) e na GeForce 8600 GTS (256 MB, GPU a 675 MHz – com as unidades de processamento a 1.45 GHz – e memória GDDR3 a 2.0 GHz).
Embora o barramento com a memória seja mais estreito, o uso de chips GDDR3 de 2.0 GHz faz com que a 8600 GTS disponha de um barramento de respeitáveis 32 GB/s. Embora possuam apenas um quarto do poder de processamento bruto das GeForce 8800 GTX, as GeForce 8600 GT e GTS são de longe mais populares, já que são placas mais baratas. Do ponto de vista do desempenho, elas não se comparam com as 8800, mas também não são de todo ruins. A 8600 GTS consegue superar a 7800 GTX por uma pequena margem na maioria dos jogos, com a vantagem de oferecer suporte ao DirectX 10.
Temos ainda o G86, usado nas placas mais baratas dentro da família, que conserva apenas uma única unidade shader unificada (um oitavo do original, com 16 stream processors) e utiliza um barramento com a memória de 128 bits ou 64 bits, de acordo com a placa onde é usado.
O chip G86 e os módulos de memória em uma GeForce 8400 GS (com o cooler removido)
Ele é usado na GeForce 8500 GT (256 MB ou 512 MB, GPU a 450 MHz – com a unidade de processamento a 900 MHz – e memória DDR2 a 800 MHz) e na GeForce 8400 GS (256 MB, GPU a 450 MHz – com a unidade de processamento a 900 MHz – e memória DDR2 a 800 MHz). A grande diferença entre as duas é que a 8500 GT utiliza um barramento com a memória de 128 bits, enquanto a 8400 GS usa um barramento de 64 bits, o que reduz o desempenho, mas em troca também torna a placa mais barata de se produzir. De uma forma geral, a 8500 GT compete com a 7300 GT em desempenho, ou seja, não espere muito. Ela é uma placa destinada a quem quer gastar o mínimo possível e não a quem espera um desempenho satisfatório nos jogos atuais.
Deixe seu comentário