O DirectX 8 foi a primeira versão a trazer suporte a shaders, mas as limitações da API, combinadas com o pequeno número de placas 3D com suporte a ele disponíveis no mercado fizeram com que a maioria dos desenvolvedores migrassem diretamente do DirectX 7 para o DirectX 9.0 (Shader Model 2) e dele para o DirectX 9.0c (Shader Model 3), que se tornou rapidamente a versão predominante.
A rápida migração para o DirectX 9.0c (que ao contrário do que o número de versão sugere foi praticamente uma nova versão) fez com que as placas DirectX 9.0/Shader Model 2 caíssem em uma espécie de limbo tecnológico, com mais potência de processamento que as anteriores, mas sem capacidade para rodarem muitos dos jogos atuais devido à falta de suporte ao Shader Model 3.
Felizmente, o limbo inclui apenas três famílias de placas: as Radeon 9700 e 9500 (baseadas no R300), as GeForce 5 FX, baseadas no NV30/N35 e as Radeon X800, baseadas no R420.
Radeon 9700: Embora a Radeon 8500 tenha superado as GeForce 3 por uma boa margem (pelo menos depois de algumas atualizações dos drivers), o reinado acabou durando pouco, já que a nvidia voltou ao topo com o lançamento das GeForce 4 Ti. A resposta da ATI veio com o lançamento do R300. A terceira geração da família Radeon, que chegou ao mercado em agosto de 2002.
O R300 é um chipset compatível com o DirectX 9.0, produzido usando uma técnica de 0.15 micron. Além do grande volume de transístores adicionais necessários para suportar o Shader model 2, a ATI optou por adicionar 4 novos pipelines de renderização, elevando a contagem para 8 e oferecendo basicamente o dobro do poder bruto do R200.
Em 2002, as memórias DDR2 e GDDR3 ainda estavam longe de entrarem em produção, por isso a única maneira de aumentar proporcionalmente o barramento com a memória foi adotar o uso de um barramento de 256 bits. Combinadas, todas as modificações elevaram a contagem de transistores do R300 para 110 milhões, o que o tornou o maior chipset 3D produzido até então. Ele foi também o primeiro chipset 3D a usar um encapsulamento FC-BGA, similar ao usado por processadores como o Pentium III e o Athlon XP:
O R300 foi também o primeiro chipset da ATI a oferecer um sistema de multisampling antialiasing, o SMOOTHVISION 2.0 (concorrendo com o Quincunx da nVidia). Embora oferecesse uma boa qualidade visual, a versão original do SMOOTHVISION (disponível na ATI 8500) utilizava um algoritmo de supersampling, o que resultava em uma grande queda no desempenho. A partir do R300 as placas passaram a suportar os dois modos de antialiasing, assim como no caso das placas nVidia a partir da GeForce 3.
Hoje em dia, isso é irrelevante, já que ao tentar jogar usando uma destas placas você seria obrigado a desabilitar o AA e a maior parte dos efeitos visuais para obter um FPS aceitável, mas na época o multisampling antialiasing foi recebido como uma grande evolução.
O R300 foi originalmente usado em duas placas, a Radeon 9700 e a Radeon 9700 Pro. Ambas utilizavam memórias DDR, AGP 8x e o barramento de 256 bits com a memória, mas se diferenciavam pelas frequências de clock. A 9700 operava a 275/540 MHz e a 9700 Pro a 325/620 MHz.
O lançamento adiantado fez com que a Radeon 9700 Pro desfrutasse de um curto reinado como a placa mais rápida do mercado, superando a GeForce 4 Ti 4600 por uma boa margem. A resposta da nVidia veio pouco depois, com o chipset NV30 e a GeForce 5 FX.
Seguindo o curso natural, a ATI produziu também duas placas de médio custo baseadas em versões castradas do R300: a Radeon 9500 Pro e a Radeon 9500. Ambas as placas oferecem as mesmas frequências que a 9700 (275 e 540 MHz) mas oferecem um desempenho muito mais baixo. A 9500 Pro perdeu dois dos canais de acesso à memória, resultando em um barramento de apenas 128 bits (equivalente ao barramento de 128 bits das GeForce 4), enquanto a 9500 perdeu também metade dos pipelines de renderização, se tornando uma espécie de “meia 9700”.
Em 2003 a ATI lançou o R350, uma versão levemente aperfeiçoada do R300 que (embora ainda produzido na mesma técnica de 0.15 micron) era capaz de atingir frequências mais altas. Ele deu origem à série 9800, que combinou placas de alto desempenho e versões castradas, com um barramento de apenas 128 bits com a memória.
As duas versões iniciais foram a Radeon 9800 (325/580 MHz) e a Radeon 9800 Pro (380/640 MHz), que se tornou o novo carro-chefe da ATI. Elas foram seguidas pela Radeon 9800 128bit e pela Radeon 9800 Pro 128bit, que foram as versões castradas, com um barramento de apenas 128 bits.
Perto do final de 2003 a ATI repetiu a fórmula usada na 9200 SE, produzindo duas versões castradas, com apenas 4 dos pipelines de renderização ativos: a Radeon 9800 SE 128bit e a Radeon 9800 SE 256bit. Embora as frequências de clock fossem as mesmas, elas eram consideravelmente mais lentas.
Em Outubro de 2003, foi lançada a Radeon 9800 XT, baseada em uma nova revisão do chipset. Ela usava clocks de 412 MHz para o core e 730 MHz para a memória, mantendo o barramento de 256 bits.
Entretanto, a grande maioria das placas produzidas foram baseadas no RV350, que foi a versão de baixo custo, com apenas 4 dos pipelines de renderização e um barramento de 128 bits com a memória. Ele foi usado na Radeon 9550 (250/400 MHz), Radeon 9600 (325/400 MHz), Radeon 9600 Pro (400/600 MHz) e Radeon 9600 Pro XT (500/600 MHz). Com exceção das 9600 Pro e XT (que já operavam perto do limite), as placas ofereciam uma boa margem de overclock, o que as tornou ainda mais atrativas.
Mantendo a tradição nefasta da série SE, a ATI lançou também a Radeon 9550 SE e a Radeon 9600 SE, duas versões capadas, com barramento de apenas 64 bits. Elas foram as placas mais lentas da série.
Todas as placas baseadas no R300/R350/RV350 foram produzidas apenas em versão AGP, que era o barramento dominante na época. Entretanto, a partir de 2004 o PCI Express passou a ganhar espaço rapidamente, o que levou a ATI a produzir também uma linha de placas PCI Express baseadas no RV370, uma versão de 0.11 micron do RV350, lançada em 2004.
A série incluiu a Radeon X300 (325/400 MHz), Radeon X300 SE (bus de 64 bits), Radeon X550 (400/500 MHz), Radeon X550 SE (400/500 MHz, 64 bits), Radeon X600Pro (400/600 MHz) e Radeon X600 XT (500/740 MHz). Além das versões com memória DDR, estas placas receberam também versões com memória DDR2, que na época já eram comuns.
Radeon X800: Diferente dos chipsets anteriores, que trouxeram grandes mudanças em relação aos modelos anteriores, o R420 foi apenas uma expansão do do R300, com mais unidades de processamento e produzido usando uma técnica de 0.13 micron com low-k dielectrics (tecnologia que reduz a capacitância dos transístores, resultando em chips capazes de atingir frequências de operação mais altas).
Apesar da arquitetura básica ter continuados basicamente a mesma, a ATI dobrou o número de pipelines de renderização no R420, elevando a contagem para 16. O pipeline de processamento de shaders foi também expandido, com 6 unidades de processamento de vertex shaders (contra 4 do R300) e novas funções.
O R420 suporta o Shader Model 2.0b, que é uma espécie de elo perdido entre as versões 2 e 3. Em 2004 a ATI realizou uma forte campanha entre os desenvolvedores, para que os títulos incluíssem suporte a ele lado a lado com o Shader Model 3. Isso fez com que as X800 ganhassem suporte a Shaders no FarCry e em outros títulos lançados em 2004, estendendo um pouco a vida útil das placas. Entretanto, a ATI logo migrou para o R520 e a linha X1xx, deixando que o R420 e o shader Model 2.0b caíssem no esquecimento. Isso fez com que apesar do bom desempenho, o R420 tivesse uma vida útil relativamente curta, assim como no caso das GeForce 5 FX.
Outra evolução incorporada ao R420 foi o suporte a memórias GDDR3 que, como vimos anteriormente, foram um aperfeiçoamento das DDR2, destinadas ao uso em placas de vídeo. Elas também realizavam 4 transferências por ciclo, mas eram capazes de atingir frequências muito mais altas, o que tornou a transição bastante rápida. A partir de 2004, todas as placas de alto desempenho passaram a usar memórias GDDR3, relegando o uso de memórias DDR2 às placas de baixo custo. A partir desse ponto as DDR desapareceram rapidamente.
Para maximizar o volume de chips aproveitáveis por wafer, a ATI implementou uma arquitetura modular no R420, onde os pipelines de renderização eram agrupados em quartetos independentes, que podiam ser seletivamente desativados em caso de defeitos, resultando em chipsets com 12, 8 ou mesmo 4 pipelines ativos. A ideia foi logo adotada também pela nVidia e é utilizada até hoje para criar muitas das linhas de placas de baixo custo, equipadas com versões castradas dos chipsets.
O R420 foi usado na série Radeon X800, que originalmente era composta pela Radeon X800 Pro (versão castrada, com 12 das unidades de processamento ativas e clocks de 475 e 900 MHz), a Radeon X800 XL (versão completa com clocks de 400 e 1000 MHz) e a Radeon X800 XT (clocks de 500 e 1000 MHz). Estas três versões foram lançadas em versão AGP e foram equipadas com memórias GDDR3, daí as altas frequências para a memória.
Juntamente com o R420, a ATI lançou também uma versão PCI Express do chipset, o R423. A mudança no barramento não alterou consideravelmente o desempenho do chip (a diferença eram inferiores a 1% na maioria dos casos) mas o desenvolvimento de chipsets com suporte nativo ao PCI Express tornou a migração muito mais transparente do que no caso da nVidia, que optou por utilizar bridges AGP>PCI Express nas primeiras placas, que prejudicavam o desempenho.
O R423 foi usado na Radeon X800 XT, onde a GPU operava a 500 MHz e as memórias GDDR3 a 1000 MHz e na Radeon X800 XT PE, que era um pouco mais rápida, com clocks de 520 e 1120 MHz.
Posteriormente foram lançadas também versões castradas de médio e baixo custo, incluindo a X800 Pro (12 unidades de processamento e clocks de 475/900 MHz), X800 GTO 128 (12 unidades, bus de 128 bits e clocks de 400 e 700 MHz), X800 GT 128 (8 unidades, bus de 128 bits, clocks de 400/980 MHz) e X800 SE (8 unidades, bus de 128 bits e clocks de 425/700 MHz). Por serem modelos de baixo custo, as três foram lançadas também em versões com memórias DDR2, mais baratas.
No final de 2004 a linha foi renovada com o lançamento do chipset R480, um re-spin do R423 produzido usando uma técnica de 0.11 micron, que permitiu à ATI reduzir o custo e aumentar o clock das placas. Ele foi usado na Radeon X850 Pro (12 unidades, clocks de 520 e 1080 MHz), Radeon X850 XT (versão completa, clocks de 520 e 1080 MHz) e Radeon X850 XT PE (clocks de 540 e 590 MHz). Estas três placas foram lançadas também em versão AGP (com os mesmos clocks e basicamente o mesmo desempenho), nesse caso utilizando o chipset R481, que oferecia uma interface AGP nativa.
Existiram também versões AGP da Radeon X800 XT e X800 XT PE, mas no caso delas foi utilizado o chipset R423 combinado com um bridge PCIe>AGP (o Rialto) que reduzia sutilmente o desempenho. Ele foi usado como uma solução de transição da ATI, antes do lançamento do R481.
No final de 2004 a ATI lançou o RV410, uma versão de baixo custo do R480 que deu origem à série X700, que se tornou a linha de maior sucesso dentro da série, concorrendo com as GeForce 6 6600 ao longo de 2005 e em seguida com os modelos low-end da GeForce 7 em 2006, uma longevidade surpreendente, considerando a falta de suporte ao Shader Model 3.
O RV410 possui apenas 8 unidades de processamento e utiliza um barramento de 128 bits com a memória, mas manteve os pipelines de processamento de shaders intocados em relação ao irmão mais velho. A ATI poderia obter o mesmo resultado desativando componentes do R480, mas optou por produzir um novo chip para manter os custos de produção baixos, já que não teria unidades defeituosas suficiente para sustentar o grande volume de produção da série X700.
A Radeon X700 foi a versão mais simples, com clock de 400 MHz para a GPU e memórias DDR 1 (ela foi a última placa da ATI a utilizá-las) operando a 350 MHz. Ela foi seguida pela Radeon X700 Pro (GPU operando a 425 MHz e memórias GDDR3 a 860 MHz) e a Radeon X700 XT (475 MHz para a GPU a 1050 MHz para as memórias).
Estas três versões iniciais foram produzidas apenas em versão PCI Express, mas não demorou para que fossem lançadas também versões AGP, utilizando o bridge PCIe>AGP. Foram produzidas também placas com memórias DDR2, que eram mais baratas que as versões GDDR3.
GeForce FX 5xxx: Quando a ATI lançou a Radeon 9700 Pro em julho de 2002, a nVidia ainda produzia as GeForce 4 Ti, que perdiam para ela por uma boa margem. A única coisa que impediu que as placas da linha Radeon 9xxx se tornassem ainda mais populares foram os drivers problemáticos.
A resposta da nVidia veio apenas em janeiro de 2003, com o lançamento do NV30, que representou a terceira grande mudança arquitetural dentro da família GeForce, incorporando suporte ao DirectX 9.
Assim como o R300, o NV30 inclui 8 pipelines de renderização, que fazem par com um barramento de 128 bits de acesso à memória. Entretanto, ele é capaz de operar a frequências de clock mais altas, o resulta em um fill-rate superior. Entretanto, a maior parte das modificações foram feitas na unidade de processamento de shaders, que ganhou suporte ao Shader Model 2.0+ (similar em recursos à versão 2.0b, suportada pelo R420 da ATI).
Em vez de produzir um chipset com várias unidades de processamento de vertex shaders independentes, a nVidia optou por criar uma grande unidade unificada, que oferecia uma grande lista de recursos. Entretanto, o resultado prático foi que estes recursos acabaram sendo utilizados por poucos jogos, já que a maioria dos títulos migrou diretamente do Shader Model 1.x (DirectX 8) ou Shader Model 2.0 (DirectX 9.0) para o Shader Model 3.0 (DirectX 9.0c), fazendo com que o Shader Model 2.0+ fosse um beco sem saída, assim como o 2.0b suportado pelas placas da ATI baseadas no R420.
Isso explica por que as placas da linha FX saíram rapidamente de produção a partir da introdução das GeForce 6 (compatíveis com o Shader Model 3.0), diferente das linhas anteriores, que tiveram uma sobrevida mais longa. Em resumo, a nVidia equipou o NV30 com um grande volume de recursos que foram pouco utilizados, fazendo com que o chipset fosse subutilizado e as placas não apresentassem um desempenho muito superior ao das GeForce 4 na maioria das situações.
De volta à arquitetura, o grande aumento no poder de processamento das unidades de ponto flutuante necessário para suportar o Shader Model 2.0+ e os demais recursos do DirectX 9 fez com que o NV30 fosse composto por nada menos que 125 milhões de transístores (produzido usando uma técnica de 0.13 micron), o que é quase o dobro do NV25, com seus 63 milhões. Pode não parecer muito se comparado aos 2.15 bilhões de um RV770 atual, mas foi um número espantoso para a época. Ele foi também o primeiro chip da nVidia a utilizar o encapsulamento FC-BGA:
O NV30 original foi usado em apenas duas placas, a GeForce FX 5800 (GPU a 400 MHz, memória GDDR2 a 800 MHz) e a GeForce FX 5800 Ultra (GPU a 500 MHz, memória GDDR2 a 1000 MHz). Entretanto, além do atraso, as duas placas falharam em superar as radeon 9700 e 9700 Pro (que embora utilizassem memórias DDR regulares, contavam com um barramento de 256 bits), o que foi um início com o pé esquerdo para a família. O exaustor barulhento da 5800 Ultra, rapidamente apelidado de “dustbuster” (aspirador de pó) também não ajudou.
Mesmo com as placas high-end apresentando um desempenho abaixo do esperado, a nVidia não teve muitas opções senão seguir o cronograma planejado de lançamentos (que é afinal definido de 6 a 12 meses antes de as placas entrarem em produção), lançando os modelos de médio e baixo custo.
O primeiro foi o NV35, uma versão reduzida, que oferecia apenas 4 pipelines de renderização, mas preservou as demais funções do chip, incluindo a unidade de vertex shader unificada e as funções de aceleração de vídeo. Ele manteve também o barramento de 128 bits, mas devido ao custo dos chips GDDR2, as placas foram equipadas com chips DDR regulares, o que limitou o desempenho na prática.
Ele foi usado na GeForce FX 5600 XT (235/400 MHz), GeForce FX 5600 (325/550 MHz), GeForce FX 5600 Ultra (350/700 MHz) e GeForce FX 5600 Ultra Rev.2 (400/800 MHz).
Estes modelos foram um caso interessante, pois apesar das melhorias no processamento de shaders, o desempenho bruto por ciclo de clock em jogos DirectX 8 não era superior ao da GeForce 4 Ti 4200. De fato, mesmo a FX 5600 Ultra perdia para ela em muitas situações, vencendo por uma boa margem apenas no desempenho com o antialiasing ativo.
Elas foram sucedidas por uma nova geração de placas de baixo custo, baseadas no chipset NV34. Ele foi um lançamento significativo por representar a primeira atualização arquitetural na linha de placas de baixo custo desde a GeForce 2 MX, já que o NV17 (série GeForce 4 MX) foi apenas uma versão de 0.15 micron no NV11, desenvolvido para ser mais barato de produzir e não para oferecer novas funções.
O NV34 oferecia apenas dois dos pipelines de renderização, com uma versão reduzida da unidade de processamento de vertex shader, com basicamente metade do desempenho bruto do NV35. Como se tratava de um chip muito menor, com pouco mais de 35 milhões de transístores, a nVidia optou por produzi-lo usando uma técnica de 0.15 micron, o que restringiu as frequências de operação.
Ele foi usado na GeForce FX 5200 (250/333 MHz), GeForce FX 5200 Ultra (325/650 MHz) e GeForce FX 5500 (270/400 MHz). Pouco depois foi lançada também uma versão PCI Express (usando um bridge AGP>PCIe), a GeForce PCX 5300 (250/400), que oferecia um desempenho similar ao da FX 5200.
Embora o desempenho da FX 5200 em jogos DirectX 7 seja inferior ao da versão de 128 bits da GeForce 4 MX 440, ela oferece uma compatibilidade muito melhor com títulos recentes, já que suporta tanto o DirectX 8 quanto o DirectX 9.0 e o Shader Model 2+, quanto a GeForce 4 MX está restrita ao obsoleto DirectX 7.
Uma última observação é que tanto a FX 5200 quanto a PCX 5300 foram produzidas também em versões com barramento de 64 bits, mantendo viva a herança nefasta da GeForce 4 MX 4000. Elas foram os modelos mais baratos dentro da série (e infelizmente também os mais comuns no Brasil) mas não é preciso dizer que o desempenho em 3D era também muito baixo, fazendo com que elas fossem mais úteis para quem queria montar micros com dois monitores ou rodar aplicativos de escritório.
Esta postagem foi modificada pela última vez em 23/03/2011 15:37