Era moderna: O G80 e as GeForce 8xxx

O G70 não trouxe nenhuma grande novidade em relação ao NV40. Ele é mais rápido, por incluir mais unidades de processamento e ser capaz de operar a frequências um pouco mais altas, mas a arquitetura é basicamente a mesma.

O G80, por sua vez, é baseado em uma arquitetura bem diferente, com o uso de unidades shader unificadas (batizadas pela nVidia de “stream processors”), que são basicamente unidades de ponto flutuante programáveis, que podem ser usados como unidades de pixel shader, unidades vertex shader ou ainda desempenhar outras funções, de acordo com a demanda. O G80 é também o primeiro chipset da nVidia compatível com o DirectX 10 (o G70 é compatível com o 9.0c) e com o Shader Model 4.0, o que representa uma garantia de compatibilidade com os jogos lançados no futuro. Ele se tornou um divisor de águas dentro da linha da nVidia, já que representa a primeira geração de chipsets programáveis, encerrando o reinado do pipeline de renderização usado nas gerações anteriores.

A vantagem de utilizar os stream processors no lugar das unidades shader dedicadas é que eles podem absorver melhor a variação na demanda por processamento de pixel shaders ou de vertex shaders por parte do aplicativo, sem gargalos. A desvantagem é que os stream processors são um pouco menos eficientes do que unidades dedicadas, por isso o G80 inclui um número muito maior deles.

Enquanto o G70 inclui 24 unidades de pixel shader e 8 unidades de vertex shader (32 no total), o G80 utiliza um conjunto de 8 clusters, com 16 unidades unificadas cada um, totalizando 128 stream processors. Dentro das unidades, as ALUs (os circuitos responsáveis pelo processamento das instruções) operam a uma frequência maior que o restante do chip (o dobro ou mais), o que representa uma melhoria importante. Com isso, a GPU da 8800 GTX, por exemplo, trabalha a 575 MHz, mas as unidades de processamento trabalham a 1.35 GHz, o que resulta em um aumento expressivo no volume de dados processados.

O chip inclui ainda pequenas porções de cache dentro de cada cluster e também dentro dos ROPs, que armazenam tanto instruções quanto texturas que estão sendo processadas. Os caches possuem uma função muito similar aos caches usados nos processadores, embora a eficiência seja mais limitada, devido ao tipo de processamento executado pela placa de vídeo.

m52c41ead

Diagrama de blocos do G80

Naturalmente, um número tão grande de unidades de processamento resultaram em um chip bastante complexo (e caro de produzir), com nada menos do que 686 milhões de transístores. O aumento nas unidades de processamento foi acompanhado por um aumento também no barramento com a memória, que passou a ser de 384 bits (dividido em 6 canais independentes, de 64 bits cada).

O G80 original foi lançado como um chip de alto desempenho, que equipou a 8800 GTX e a 8800 Ultra, que foram as duas placas mais rápidas da nVidia até o início de 2008:

GeForce 8800 GTX: 128 SPs, 24 ROPs, 768 MB de GDDR3, bus de 384 bits, clocks de 575 MHz (core), 1350 MHz (shaders) e 1800 MHz (memória). TDP de 155 watts.

GeForce 8800 Ultra: 128 SPs, 24 ROPs, 768 MB de GDDR3, bus de 384 bits, clocks de 612 MHz (core), 1500 MHz (shaders) e 2160 MHz (memória). TDP de 171 watts.

Mantendo a distinção entre as linhas GTX e GTS, a nvidia lançou também uma versão de baixo custo, a 8800 GTS. Ela utiliza uma versão castrada do G80, com duas das unidades shader unificadas desativadas (resultando em apenas 96 stream processors funcionais), clocks mais baixos e um barramento com a memória de apenas 320 bits, combinado com o uso de apenas 20 ROPs (contra 24 da 8800 GTX):

GeForce 8800 GTS: 96 SPs, 16 ROPs, 320 ou 640 MB de GDDR3, bus de 320 bits, clocks de 513 MHz (core), 1188 MHz (shaders) e 1584 MHz (memória). TDP de 143 watts.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X