Radeon HD 7970: 28 nm, 4.3 bilhões de transístores e nova arquitetura

Radeon HD 7970: 28 nm, 4.3 bilhões de transístores e nova arquitetura

Embora o mercado de GPUs dedicadas venha encolhendo nos últimos tempos, fruto da entrada no mercado das APUs da AMD e da Intel, a briga histórica entre a AMD e a nVidia continua a todo vapor, com as duas disputando a cada nova geração o posto de GPU high-end mais rápida.

O mais novo capítulo da saga é a recém anunciada Radeon HD 7970, que marca a migração da AMD para o uso da técnica de 28 nm, uma técnica half-node que serve como um meio termo entre os 32 nm ainda usados na maioria os processadores atuais e os 22 nm recentemente estreados pela Intel no Ivy Bridge.

radeon hd 7970

A nova técnica de produção permitiu que a AMD adicionasse 1.7 bilhão de transístores aos já espantosos 2.6 bilhões da Radeon HD 6970, chegando a um total de 4.3 bilhões de transístores (mil vezes mais do que um Pentium MMX!) em um chip de apenas 365 mm², o que a coloca em vantagem em relação à nVidia em termos de custos de produção, já que a GeForce GTX 580 é baseada em uma GPU com pouco mais de 3 bilhões de transístores, que ocupa nada menos do que 520 mm², bem mais cara de se produzir.

Além da mudança da técnica de produção, a AMD investiu em uma nova arquitetura, substituindo os clusters VLIW usados nas gerações anteriores por unidades computacionais batizadas de GCN (Graphics Core Next):

radeon cgn2

Esta nova arquitetura é uma resposta da AMD à arquitetura Fermi da nVidia, oferecendo uma arquitetura mais flexível, que é capaz de executar eficientemente tanto tarefas gráficas quanto tarefas computacionais. Cada unidade GCN é um processador superescalar, incluindo um agendador de instruções, unidades de processamento de vetores, registradores, espaço para armazenamento de dados locais, unidades de processamento de texturas e até mesmo um pequeno cache L1.

O núcleo, batizado de Tahiti contém originalmente 32 unidades computacionais (totalizando 2048 stream processors), mas como de praxe o número final variará de acordo com o modelo da placa, com a 7970 vindo com todos os núcleos ativos e outros modelos mais baratos trazendo um número progressivamente menor.

radeon cgn

O chip é composto também por 8 unidades ROP (capazes de processar 32 ROPs por ciclo de clock) e 128 unidades de processamento de texturas e inclui um cache L2 de até 768 KB (partes podem ser desativadas de acordo com o modelo, assim como no caso das unidades de processamento) e oferece um barramento de 384 bits com a memória (contra os 256 bits da 6970), que é ainda de certa forma conservador para uma placa high-end, mas que ainda assim oferece até 264 GB/s de banda em conjunto com memórias GDDR5. Ele também suporta o PCI Express 3.0, embora naturalmente mantenha a compatibilidade com placas baseadas em padrões anteriores, já que no final de 2011 ainda sequer temos placas-mãe e chipsets PCIe 3.0 no mercado.

A Radeon HD 7970 é também a primeira placa a suportar o Direct3D 11.1, que é uma pequena atualização da API, focada principalmente em melhoras da interoperabilidade entre as GPUs e o Windows 8. Se comparado às grandes mudanças introduzidas pelo 10.1 em relação ao 10.0 ou do 9.0c em relação ao 9.0b, o 11.1 é uma atualização muito menos importante, mas de qualquer forma é importante para a AMD suportá-la na nova arquitetura, que deverá continuar no mercado por pelo menos mais um ano.

A nova família de GPUs, da qual a Tahiti é a primeira será composta por mais duas GPUs menores, batizadas de Pitcairn e Cape Verde, que serão progressivamente menores, atendendo às placas mid-range. Assim como em outros lançamentos, a AMD começou com o high-end, deixando para lançar as demais placas da família ao longo do primeiro semestre. Da mesma forma, teremos em breve o lançamento de uma versão dual-GPU, que sucederá a 6990.

southislands

A Radeon HD 7970 é uma placa avantajada, com 27 cm de comprimento, mesmo tamanho da 6970 e da GTX 580. Apesar da nova técnica de produção, a GPU opera a 925 MHz (um clock apenas 5% mais alto que a 6970) e 3 GB de memória GDDR5, operando a 1.375 GB (5.5 GHz efetivos). Como de praxe, uma placa com tanta memória torna obrigatório o uso de um sistema operacional de 64 bits, caso contrário os 3 GB da placa de vídeo ocuparão quase toda a área de endereçamento de um processador operando em modo de 32 bits, deixando muito pouca memória disponível para uso do sistema operacional.

radeonhd7970a

A princípio o poder de fogo da HD 7970 parece à frente de seu tempo, já que poucos jogos são capazes de usar tanto processamento e memória, mesmo a 1600×900. É preciso usar cenários pouco realísticos, como o Crysis Warhead a 2560×1600 com as texturas gigantes do modo entusiasta para fazer a placa cair abaixo dos 60 FPS. Naturalmente, você poderia usá-la para jogar Left 4 Dead a três ziguilhões de frames por segundo, mas isso não representaria nenhuma grande vantagem prática em relação à geração anterior. A resposta da AMD para o impasse continua sendo o Eyefinity, que permite o uso de três ou mais monitores, fazendo com que a GPU tenha o que fazer:

big amd ati eyefinity

Diferente do que tínhamos a dois anos atrás, quando a tecnologia foi anunciada, um grande número de títulos recentes são capazes de fazer uso dos monitores adicionais, usando-os para aumentar a área visível, e não apenas para mostrar uma imagem cortada ou esticada. Com três monitores, que é a configuração mais comum e útil, o monitor central continua a exibir a mesma imagem que mostraria normalmente, mas os dois monitores laterais oferecem uma visão periférica que melhora a imersão e oferece uma vantagem competitiva. Com monitores de 19″ chegando a custar menos de 300 reais, esta está se tornando uma opção acessível.

A 7970 suporta até três monitores nativamente (usando as duas portas mini-DisplayPort 1.2), mas é possível usar até seis monitores com o uso de um multi-stream hub. Para quem achou pouco, é possível usar duas placas em CrossFire, mas os US$ 550 por placa vão fazer os interessados pensarem duas vezes.

radeon back

Além dos jogos e da área de trabalho extendida, a AMD está explorando novos usos para o uso de múltiplos monitores. Uma ideia que faz sentido é o uso do canal de áudio oferecido pelo HDMI e pelo DisplayPort para oferecer saídas de áudio independentes para cada monitor, uma possibilidade que pode ser bem explorada por aplicativos de vídeo-conferência, permitindo que você fale com três participantes, cada um em tela cheia em um dos monitores e com uma saída de áudio própria na base do monitor. Por enquanto este é um conceito puramente teórico, mas pode ser que a ideia eventualmente acabe pegando. 

ddma

Além do uso de múltiplos monitores, outra possibilidade muito importante é o potencial da placa em tarefas computacionais, que deve ser bem explorada em supercomputadores e aplicativos específicos. De fato a AMD vem cortejando desenvolvedores desde junho, quando detalhes preliminares da arquitetura foram abertos a desenvolvedores, com o objetivo de que eles passassem a trabalhar no desenvolvimento e otimização de código para a nova arquitetura. O movimento da AMD rumo a este mercado profissional é fruto de uma necessidade simples: melhorar as margens de lucro. Embora as GPUs para gamers também dêem dinheiro, as margens de lucro em produtos para o mercado profissional (como no caso das linhas Quadro e Tesla da nVidia), bem como placas para o mercado de computação de alto desempenho.

A nova arquitetura é também uma dica da estratégia da AMD para as próximas gerações de APUs Fusion, que devem incluir núcleos computacionais similares aos encontrados no Tahiti, permitindo que mais tarefas possam ser executadas pela GPU.

Ainda dentro da questão comercial, outro ponto importante é que a Radeon HD 7970 continua sendo produzida pela TSMC, em vez de pela Global Foundries. Quando a AMD se dividiu em duas, abrindo mão de sua divisão de produção, se especulava que um relacionamento forte entre a AMD (agora uma empresa fabless) e a Global Foundries seria fundamental para as duas empresas, já que a Global Foundries poderia oferecer tecnologia de ponta para a fabricação dos processadores, APUs e GPUs da AMD, enquanto a AMD forneceria volume de produção à GF. No final entretanto, o relacionamento entre as duas empresas continua sendo no mínimo desconfortável, com a AMD continuando a preferir a TSMC para a produção das GPUs e ameaçando mover até mesmo a produção das APUs para outro parceiro, fruto de desentendimentos em relação aos preços e condições de produção. Este é um fator de enfraquecimento para as duas empresas.

globalfoundriesdresden

Concluindo, temos o VCE, que é a resposta da AMD ao Quick Sync introduzido pela Intel no Sandy Bridge. O Quick Sync é baseado no uso de um decodificador dedicado, que é bastante eficiente em codificar vídeos H.264, permitindo que mesmo sistemas de baixo consumo baseados no Sandy Bridge sejam capazes de codificar vídeo H.264 em tempo real, algo que era antes impensável. Mesmo consumindo muito mais energia, as GPUs da AMD e da nVidia eram de 2 a 4 vezes mais lentas na tarefa, mesmo rodando aplicativos de conversão otimizados.

Similar ao Quick Sync, o VCE é baseado no uso de um controlador dedicado, incluído na GPU. Ele é capaz de funcionar em dois modos. No Full Mode o controlador dedicado assume todo o trabalho, permitindo que você jogue e execute outras tarefas que ocupem a GPU ao mesmo tempo em que converte vídeos, enquanto o Hybrid Mode faz uso da capacidade computacional do restante da GPU, resultando em um consumo de energia mais alto, mas em compensação em um desempenho ainda melhor. Espera-se que no Hybrid Mode a conversão possa ser feita em metade a um terço do tempo do vídeo, permitindo converter filmes inteiros em menos de uma hora. Naturalmente, isso ainda precisa ser comprovado em benchmarks com versões de produção da placa, mas não deixa de ser uma possibilidade animadora. 

vce

Em relação ao desempenho em jogos, a 7970 é consideravelmente mais rápida que a Geforce GTX 580, que é a concorrente single-GPU direta, com uma vantagem variando em de 10 a 30% de acordo com o título segundo os benchmarks do Anandtech. Ela também fica de 12 a 35% à frente da 6970, servindo como um upgrade respeitável à antecessora.

Apesar dos ganhos, ela não chega a superar a Radeon HD 6990 nem a GTX 590, que apesar de estarem tecnicamente uma geração atrás, são placas dual-GPU com bem mais poder de fogo bruto. Apesar disso, a diferença em alguns títulos é relativamente pequena, como no caso do Metro 2033, onde a 7970 fica apenas 10% atrás da GTX 590 a 2560×1600.

Sobre o Autor

Avatar de Carlos E. Morimoto
Redes Sociais:

Deixe seu comentário

X