Placas 3D: GeForce 7 e Radeon X1800

Continuando a explicação sobre os chipsets DirectX 9.0c, que comecei no post de ontem, com o NV40 e a GeForce 6, temos agora o G70 e o R520. Eles reinaram em 2006 e início de 2007, equipando as placas da nVidia e da ATI, até que finalmente deram lugar aos chipsets DirectX 10 usados atualmente.

O G70 é o chip usado nas placas da série GeForce 7800. A arquitetura interna é similar à do NV40 e, assim como ele, o G70 é compatível com o DirectX 9.0c e o Shader Model 3.0. A grande diferença entre os dois é que o G70 possui quase 50% mais poder bruto de processamento por ciclo de clock, com 24 unidades de pixel shader, 24 unidades de processamento de texturas e 8 unidades de vertex shader, formando um chip com 302 milhões de transístores.

Outra vantagem sobre o NV40 é que ele é fabricado em uma técnica de 0.11 micron, o que permite o uso de frequências um pouco mais altas, além de reduzir o consumo elétrico do chip. O G70 é também o primeiro chipset da nVidia a utilizar o barramento PCI Express nativamente, sem o uso do bridge HSI usado nas placas da geração anterior. Também existem placas da série GeForce 7 em versão AGP, mas neste caso utilizando um bridge PCI Express > AGP, que reduz sutilmente o desempenho da placa, similarmente ao que ocorre nas versões PCI Express das placas da série GeForce 6.

Para não aumentar demasiadamente o custo de produção das placas, a nVidia optou por manter o barramento de 256 bits com a memória usado no NV40, aumentando a taxa de transferência apenas através do uso de chips de memória mais rápidos. Isso limitou um pouco o desempenho das placas baseadas no G70, impedindo que o chipset manifestasse todo o seu potencial em diversas situações.

Uma característica do G70, que acabou sendo adotada nos chipsets subsequentes, é o uso de um número menor de ROPs do que de unidades de texturas e unidades de pixel shader. Em vez de utilizar o mesmo número, como no NV40 e derivados, o G70 possui apenas 16 ROPs, o que significa uma proporção de 2 para 3 em relação às demais unidades, que são 24. A ideia por trás da redução é que nem todos os pipelines trabalham com 100% de carregamento todo o tempo, já que processam diferentes partes da imagem.

Um novo componente, o fragment crossbar, faz com que os dados gerados pelos pipelines sejam enviados a qualquer um dos ROPs disponíveis. Isso faz com que o número menor de ROPs absorva melhor a variação de uso dos pipelines, permitindo que o poder de processamento disponível seja melhor aproveitado. Este diagrama da nVidia ilustra o conceito:

Naturalmente, um ROP para cada pipeline ofereceria um desempenho um pouco melhor em diversas situações, mas em compensação exigiria o uso de mais transístores, o que encareceria o chip. A ideia é que a arquitetura 24/16 do G70 oferece um desempenho superior ao que seria possível obter com uma arquitetura 20/20, onde teríamos menos pipelines e os ROPs adicionais acabariam sendo subutilizados. Esta ideia de utilizar uma arquitetura flexível, no lugar de unidades fixas tem sido usada em uma escala cada vez maior nas GPUs atuais.

O G70 foi utilizado na GeForce 7800 GT (256 MB, GPU a 400 MHz e memória a 1.0 GHz), GeForce 7800 GTX (256 MB, GPU a 430 MHz e memória a 1.2 GHz) e na GeForce 7800 GTX 512 (512 MB, GPU a 550 MHz e memória a 1.7 GHz), sendo que as três eram equipadas com memórias GDDR3 e utilizavam o barramento PCI Express. Pouco depois (fevereiro de 2006), foi lançada também uma versão AGP, a GeForce 7800 GS (256 MB, GPU a 375 MHz e memória a 1.2 GHz).

É importante notar que apenas a 7800 GTX e a 7800 GTX 512 são baseadas na versão “completa” do G70. A 7800 GT é baseada em uma versão castrada, com apenas 20 das unidades de pixel shader, 20 unidades de processamento de texturas e 7 das unidades de vertex shader ativas, enquanto a 7800 GS usa uma versão ainda mais limitada, com apenas 16 unidades de pixel shader, 16 unidades de texturas, 8 ROPs e 6 das unidades de vertex shader. O uso da versão simplificada do G70, combinado com o clock mais baixo da GPU e o uso do bridge, fazem com que a 7800 GS seja consideravelmente mais lenta do que a 7800 GT.

Como de praxe, as versões originais da 7800 foram seguidas por versões mais simples, baseadas em versões reduzidas do chip NV70 e em seguida também por versões mais rápidas, baseadas no G71.

O G73 é uma versão reduzida do G70, que (assim como o NV43 em relação ao NV40) teve todas as características reduzidas à metade. Ele possui apenas 12 unidades de pixel shader, 8 ROPs e usa um barramento com a memória de apenas 128 bits. A única exceção fica por conta das unidades de vertex shader, que são 5 (em vez de 4). Com a redução, o chip passou a ter apenas 170 milhões de transístores, o que, combinado com uma técnica de produção de 0.09 micron, tornou o chip muito mais barato de se produzir, possibilitando o surgimento da classe de placas intermediárias dentro da família GeForce 7.

A versão original do G73 é usada na GeForce 7600 GS (256 MB, GPU a 400 ou 560 MHz e memória DDR2 a 800 MHz) e na GeForce 7600 GT (256 MB, GPU a 560 GHz e memória GDDR3 a 1.4 GHz). Temos também a GeForce 7300 GT (256 MB, GPU a 350, 400 ou 500 MHz e memória DDR2 a 667 ou 800 MHz), que é baseada em uma versão castrada, com 8 unidades de pixel shader, 8 ROPs e 4 unidades de vertex shader.

O seguinte na escala de redução é o G72, um chip drasticamente reduzido, que conserva apenas 4 unidades de pixel shader, 3 unidades de vertex shader e utiliza um barramento com a memória de apenas 64 bits. Ele é utilizado nas GeForce 7200 e 7300, placas de baixo custo e sucessoras diretas das 6200, que combinam o fraco desempenho do G72 e o limitado barramento com a memória com o uso de chips de memória mais baratos e mais lentos.

O G72 “completo” é usado nas GeForce 7300 LE (128 ou 256 MB, GPU a 450 MHz e memória DDR a 667 MHz) e na GeForce 7300 GS (128 MB ou 256 MB, GPU a 550 MHz e memória DDR2 a 810 MHz).

Por estranho que possa parecer, existe ainda uma versão castrada do chip, ainda mais fraca, com apenas 2 unidades de pixel shader, 2 unidades de texturas, 2 unidades de vertex shader e 2 ROPs. Ela é usada na GeForce 7200 GS (64, 128 ou 256 MB, GPU a 450 MHz e memória DDR a 667 ou DDR2 a 800 MHz) e na GeForce 7300 SE (128 MB ou 256 MB, GPU a 450 MHz e memória DDR a 667 MHz). Estas placas são destinadas ao uso de dois monitores e para uso em aplicativos de escritório (servindo como uma opção de baixo custo para PCs sem vídeo onboard) e não para jogos.

Existiram ainda alguns raros modelos das 7200 e 7300 com 512 MB, mas estas versões são mais caras e acabam se revelando uma opção muito ruim, pois o estreito barramento com a memória e o baixíssimo desempenho do chipset impede que os 512 MB sejam utilizados efetivamente.

Vale lembrar que estas 4 placas utilizam um barramento com a memória de apenas 64 bits, que acentua a baixa frequência de operação dos módulos. A 7300 LE, por exemplo, dispõe de um barramento com a memória de apenas 5.3 GB/s, cerca de 7 vezes menos que a 7800 GTX, que dispõe de um barramento de 38.4 GB/s.

Concluindo, temos o G71, que deixei por último. Ele é uma versão aperfeiçoada do G70, produzido usando uma técnica de 0.09 micron, que deu origem às placas mais rápidas dentro da série.

Ele foi usado na GeForce 7900 GS (256 MB, GPU a 450 MHz e memória a 1.32 GHz), GeForce 7900 GT (256 MB, GPU a 450 MHz e memória a 1.32 GHz), GeForce 7900 GTO (512 MB, GPU a 650 MHz, memória a 1.32 GHz), GeForce 7900 GTX (512 MB, GPU a 650 MHz e memória a 1.6 GHz), GeForce 7950 GT (256 MB ou 512 MB, GPU a 550 MHz e memória a 1.4 GHz) e também na GeForce 7950 GX2 (2×512 MB, duas GPUs a 500 MHz e memória a 1.2 GHz), que é o resultado da combinação de duas placas, ligadas internamente em SLI:

Você pode ter achado estranho que a 7900 GS e a 7900 GT utilizem as mesmas frequências tanto para a GPU quanto para a memória. A diferença entre as duas é que a GeForce 7900 GS é baseada em uma versão castrada do G71 que, assim como o G70 usado na 7800 GT, possui apenas 20 das unidades de pixel shader e 7 das unidades de vertex shader ativas, enquanto a 7900 GS é baseada na versão completa do chip. Naturalmente, todas estas placas utilizam memórias GDDR3. Dentro da série GeForce 7, apenas as placas de mais baixo custo, incluindo as 7200, 7300 e a 7600 GS utilizam memórias DDR ou DDR2 convencionais.

R520 e a Radeon X1800: Embora as Radeon 9700 e X800 tenham levado vantagem sobre as GeForce 4 e GeForce FX, a ATI acabou ficando para trás durante a migração para o DirectX 9.0c, deixando que a nVidia recuperasse a dianteira com a GeForce 6.

A resposta veio apenas no final de 2005, com o lançamento do R520, o primeiro chipset da ATI a suportar o DirectX 9.0c e ao Shader Model 3.0, que deu origem à série X1000, com a qual a ATI enfrentou o avanço das GeForce 7.

O R520 original possui 16 unidades de processamento de texturas, 16 unidades de pixel shader, 16 ROPs e 8 unidades de vertex shader, alimentadas por um barramento de 256 bits com a memória. Ao contrário da nVidia, que utilizava o bridge HSI nas versões do NV40 destinadas às placas PCI Express, o que causava uma pequena redução no desempenho, a ATI optou por produzir versões separadas do R520 (e derivados) em versão PCI Express e AGP. Acessando o barramento de forma direta, as placas em versão PCI Express realmente eram um pouco mais rápidas que as AGP.

O R520 foi utilizado nas placas Radeon X1800 GTO (256 MB, GPU a 500 MHz e memória GDDR3 a 1.0 GHz), Radeon X1800 XL (256 MB, GPU a 500 MHz e memória GDDR3 a 1.4 GHz) e na Radeon X1800 XT (256 ou 512 MB, GPU a 625 MHz e memória GDDR3 a 1.5 GHz).

A X1800 GTO original utilizava uma versão castrada do R520, com apenas 12 unidades de texturas, 12 unidades de pixel shader e 12 ROPs ativos, mas ela foi logo substituída por uma versão atualizada (a X1800 GTO Rev.2), que vem com o R520 completo.

Continuando o trabalho de modularização que iniciou no R420, a ATI continuou a utilizar a mesma família de chipsets em diversas placas diferentes, que vão desde modelos de baixo custo e chipsets integrados, até placas de alto desempenho. A receita é basicamente a mesma: desenvolver diferentes versões do mesmo chipset, adicionando, removendo ou desativando componentes internos, de forma a produzir as várias combinações de custo e desempenho desejadas.

O RV515 é a versão mais simples. Ele possui apenas um quarto das unidades de processamento do R520, contando com 4 unidades de texturas, 4 unidades de pixel shader, 4 ROPs e 2 unidades de vertex shader. Apesar da redução de 4 para 1 das unidades de processamento, o R515 conserva um barramento com a memória de 128 bits, o que ajuda a manter o desempenho das placas em níveis aceitáveis, apesar dos lentos módulos SDRAM e GDDR2 usados.

Ele foi usado na Radeon X1300 (128 ou 256 MB, GPU a 450 MHz e memória SDRAM a 250 MHz), Radeon X1300 Pro (256 MB, GPU a 600 MHz e memória GDDR2 a 800 MHz) e na Radeon X1550 (256 MB, GPU a 550 MHz e memória GDDR2 a 800 MHz), os modelos mais lentos e baratos dentro da série.

O seguinte é o RV530, um chip intermediário, que possui 12 unidades de pixel shader, 4 unidades de texturas, 4 ROPs e 5 unidades de vertex shader. O reforço nas unidades de processamento de shaders faz com que as placas baseadas no RV530 sejam muito mais rápidas do que as baseadas no R515 nos jogos mais atuais, que utilizam shaders de forma extensiva.

Ele é usado na Radeon X1300 XT (128, 256 ou 512 MB, GPU a 500 MHz e memória GDDR2 a 800 MHz), Radeon X1600 Pro (128, 256 ou 512 MB, GPU a 500 MHz e memória GDDR2 a 800 MHz), Radeon X1600 XT (256 MB, GPU a 590 MHz e memória GDDR3 a 1380 MHz) e na Radeon X1650 Pro (256 ou 512 MB, GPU a 600 MHz e memória GDDR2 a 700 MHz).

As placas baseadas no RV530 ofereceram um bom desempenho para a época, considerando que eram placas relativamente baratas. A X1600 XT, por exemplo, era vendida na mesma faixa de preço da GeForce 6600 GT, mas era capaz de superar a 6800 GT (consideravelmente mais cara) em diversas situações.

O problema com as placas da ATI, de forma geral continuaram sendo o fraco desempenho em OpenGL e a baixa qualidade dos drivers Linux, o que se revelavam dois pontos fracos importantes em diversas situações.

Continuando, apesar de possuir uma numeração inferior, a X1300 XT é bem mais poderosa que a X1550, já que as duas placas utilizam quase a mesma frequência de operação e a 1300 XT é baseada no R530. Esse tipo de variação é muito comum também nas placas da nVidia, onde as placas mais simples dentro de uma nova linha são quase sempre muito mais lentas que as placas de médio e alto desempenho da família anterior (como no caso das GeForce 7200 e da 8400 GS, que perdem para, respectivamente, as GeForce 6800 e 7900 por uma grande margem), por isso é sempre importante checar as especificações.

Dentro da nomenclatura adotada pela ATI, temos, em ordem hierárquica, as versões “LE” e “SE” (séries de baixo custo), GT, RX e GTO (placas intermediárias) e, finalmente as XL, XT e XTX, que são as placas high-end. A categoria “Pro” era originalmente usada em relação às placas mais caras, mas a partir das Radeon X1000 passou a ser usado em séries de baixo custo, ou intermediárias, abaixo das GTO, XL, XT e XTX. Dois exemplos são a X1300 Pro, que é, dentro da série, superior apenas à X1300 regular e a x1950 Pro, que ganha apenas da x1950 GT.

Continuando, outra versão intermediária é o RV560, que possui 24 unidades de pixel shader, 8 unidades de texturas, 8 ROPs e 8 unidades de vertex shader, mas conserva o barramento de 128 bits com a memória do RV530. Ele é usado na Radeon X1650 XT (256 MB, GPU a 575 MHz e memória GDDR3 a 1.4 GHz).

O seguinte é o RV570, que possui 36 unidades de pixel shader, 12 unidades de texturas, 12 ROPs e 8 unidades de vertex shader. Ao contrário do RV560, ele utiliza um barramento de 256 bits, necessário para evitar que a comunicação com a memória se tornasse um gargalo.

Ele foi utilizado na Radeon X1950 GT (256 ou 512 MB, GPU a 500 MHz e memória GDDR3 a 1.2 GHz) e na Radeon X1950 Pro (256 ou 512 MB, GPU a 575 MHz e memória GDDR3 a 1.38 GHz). Estas duas placas concorriam diretamente com as GeForce 7900 da nVidia, tanto que, durante toda a primeira metade de 2006, a X1950 Pro e a 7900 GS custavam (preço de tabela, nos EUA), exatamente o mesmo: US$ 199, enquanto a X1650 Pro custava US$ 149 e as X1300 custavam abaixo de US$ 99.

Concluindo, temos também o R580, uma versão expandida do R520, que mantém as 16 unidades de texturas, os 16 ROPs e as 8 unidades de vertex shader, mas traz o triplo de unidades de pixel shader, num total de 48, mantendo o barramento de 256 bits com a memória. Esta proporção de 3 unidades de pixel shader para cada unidade de texturas não ajuda muito no desempenho da placa em jogos antigos, mas é uma melhora bem vinda ao rodar títulos de 2007 em diante.

O F.E.A.R, por exemplo, utiliza até 7 operações aritméticas (executadas pelas unidades de pixel shader) para cada operação envolvendo texturas, enquanto no Splinter Cell: Chaos Theory a proporção é ainda maior, com 8 operações aritméticas para cada operação envolvendo texturas. Do ponto de vista da longevidade do chip, a decisão de usar 48 unidades de pixel shader foi acertada.

O R580 foi usado em um grande número de placas da série X1900, entre elas a Radeon X1900 XT (256 ou 512 MB, GPU a 625 MHz e memória GDDR3 a 1.45 GHz), Radeon X1900 XTX (512 MB, GPU a 650 MHz e memória GDDR3 a 1.55 GHz), Radeon X1950 XT (256 ou 512 MB, GPU a 625 MHz e memória GDDR3 a 1.8 GHz) e a Radeon X1950 XTX (512 MB, GPU a 650 MHz e memória GDDR3 a 2.0 GHz).

Estas eram as placas topo de linha da ATI que, na época do lançamento, eram vendidas (no EUA) na faixa dos 500 dólares. Uma opção um pouco mais barata foi a Radeon X1900 GT (256 MB, GPU a 575 MHz e memória GDDR3 a 1.2 GHz), baseada em uma versão castrada do R580, com apenas 36 unidades de pixel shader, 12 unidades de texturas, 12 ROPs e 8 unidades de vertex shader.

Ver Mais

Esta postagem foi modificada pela última vez em 23/03/2011 15:37

Postagem relacionada