AMD: Entendendo o Bobcat/Brazos/Zacate/Ontario

AMD: Entendendo o Bobcat/Brazos/Zacate/Ontario

Inicialmente, a AMD tentou atacar o mercado móvel com versões de baixo consumo do velho Athlon 64, operando com tensões e clocks baixos para reduzir o tanto quanto possível o consumo elétrico. Estes processadores ganhavam facilmente do Atom em matéria de desempenho, mas mesmo com todos os tweaks, o consumo elétrico era alto demais para uso em netbooks e ultraportáteis, o que levou a AMD a desenvolver uma arquitetura especializada para o segmento.

A lição aprendida pela AMD é essencialmente a mesma da Intel: uma dada arquitetura pode geralmente atender uma determinada ordem de magnitude de desempenho e consumo elétrico. Um processador que em seus modelos high-end trabalha sob um TDP de 100 watts, pode trabalhar dentro de um TDP de 10 watts no low-end através da redução do clock e tensões, mas nunca chegar a 1 ou 2 watts por exemplo. Para os netbooks e tablets, é necessário oferecer processadores que são capazes de trabalhar na faixa dos 1 a 10 watts, uma ordem de magnitude inteira menos que os processadores para desktop. A Intel respondeu a essa questão com o Atom, enquanto a AMD tomou um rumo completamente diferente com o Bobcat, que deu origem à plataforma Brazos, que por sua vez se subdivide na linha Zacate (a linha para notebooks e desktops, com um TDP de até 18 watts) e a linha Ontario (a linha de baixo consumo, com TDPs abaixo de 9 watts).

Do ponto de vista da arquitetura, o Bobcat tem pouco em comum com o Phenom II e os demais processadores da linhas Stars, oferecendo uma arquitetura relativamente modesta, com mais similaridades com o antigo K6 do que com os modelos desktop atuais da AMD. O Bobcat oferece uma arquitetura dual-issue, capaz de executar duas instruções por ciclo, assim como o Atom. A diferença crucial é na parte de execução, já que o Atom mantém a velha arquitetura de execução em ordem do velho Pentium 1, enquanto o Bobcat implementa uma arquitetura de execução fora de ordem, assim como nos processadores atuais:

01

Na parte dos caches, o Bobcat oferece 64 KB de cache L1 (dividido em dois blocos de 32 KB, para dados e instruções) e um cache L2 mediano, de 512 KB. Ele é um processador de 64 bits, compatível também com as instruções SSE4 e virtualização, embora não ofereça uma função similar ao HyperThreading.

O uso de um design de execução fora de ordem é uma grande vantagem do ponto de vista do desempenho, mas por outro lado causa um grande aumento no consumo elétrico do processador. Para reduzir o aumento, a AMD implementou uma série de melhoras na questão do gerenciamento elétrico, oferecendo degraus de frequência mais granulares, uso de arquivos de registro físicos (que reduzem o número de operações de transferência de dados dentro do processador, economizando energia), gerenciamento independente dos arrays dentro do processador com um controle ciclo a ciclo de clock do desligamento de componentes que não estão sendo utilizados, melhorias no circuito de branch prediction e melhorias nos circuitos e trilhas de alimentação para reduzir as perdas devido ao gate leakage. Combinadas todas estas melhorias, a AMD chegou a um processador bastante equilibrado, que oferece um desempenho por ciclo de clock muito superior ao Atom, sem um aumento tão grande no consumo elétrico.

O Bobcat em si é apenas um núcleo de processamento, que pode ser combinado com outros componentes para criar APUs completas. A fórmula básica da AMD é combinar dois núcleos Bobcat e uma GPU, o que cria uma plataforma bem equilibrada, com um mediano poder de processamento e também um bom desempenho 3D, comparável com o oferecido pelas placas dedicadas mais básicas. Para aproveitar núcleos com defeitos de fabricação, a AMD oferece também versões single-core, mas elas nada mais são do que versões regulares, com um dos núcleos de processamento desativado. Nada impede também que no futuro a AMD crie versões com 4 núcleos, já que o Bobcat é relativamente pequeno.

A AMD adotou uma metodologia muito similar à usada no desenvolvimento de suas GPUs no Bobcat, criando um núcleo de processamento que oferece um bom poder de processamento por ciclo de clock e, assim como os núcleos de processamento usadas nas GPUs da linha Radeon,  pode ser facilmente combinado com outros componentes. Por outro lado, a metodologia levou a processadores que não são capazes de atingir frequências de clock muito altas, fazendo com que a linha ficasse ainda mais dependente do que de costume da migração para novas técnicas de produção. O Bobcat utiliza um pipeline de apenas 15 estágios, ainda menos que os 16 estágios do Atom, o que ajuda a limitar o consumo elétrico, mas por outro lado restringe seriamente a frequência de operação, ancorando o processador à casa dos 1 a 2 GHz.

Como processador, o Bobcat é mediano, destinado a concorrer com os processadores Intel das linhas Pentium e Celeron, bem como com o Atom, em notebooks, netbooks e PCs de baixo custo. A grande força da plataforma fica por conta da GPU, que é exatamente o grande motivo de a AMD ter adquirido a ATI.

02

A linha original incluía apenas 4 modelos, o E350, E-240, C-50 e C-30, os dois primeiros destinados aos notebooks e sub-desktops e os outros dois destinados aos netbooks, mas ela foi logo reforçada com o E-450, E-300 e o C-60, que ofereceram um leve upgrade aos modelos anteriores:

AMD E-450: Dual-core, 1.65 GHz, 18 watts e GPU Radeon HD 6330 (80 cores, 600 MHz)
AMD E-350: Dual-core, 1.6 GHz, 18 watts e GPU Radeon HD 6310 (80 cores, 500 MHz)
AMD E-300: Dual-core, 1.3 GHz, 18 watts e GPU Radeon HD 6310 (80 cores, 500 MHz)
AMD E-240: Single-core, 1.5 GHz, 18 watts e GPU Radeon HD 6310 (80 cores, 500 MHz)
AMD C-60: Dual-Core 1.0 GHz (turbo para 1.33 GHz), 9 watts e Radeon HD 6290 (400 MHz)
AMD C-50: Dual-Core 1.0 GHz, 9 watts e GPU Radeon HD 6250 (80 cores, 280 MHz)
AMD C-30: Single-Core 1.2 GHz, 9 watts e GPU Radeon HD 6250 (80 cores, 280 MHz)

Veja que existe uma disparidade grande de frequência entre as linhas “E” (Zacate) e a “C” (Ontario), devido à grande diferença no TPD. Não apenas a frequência dos processadores mas também a das GPUs é mais bem mais baixa, uma vez que é justamente a GPU a responsável pela maior parte do consumo total. Isso fica claro quando vemos a disposição física dos componentes. Cada núcleo Bobcat ocupa menos de 1/4 do espaço ocupado pela GPU. Podemos dizer que o Brazos é mais uma GPU com processador integrado do que um processador com GPU integrada:

 

03

Tanto o Zacate quanto o Ontario utilizam a mesma GPU, com os mesmos 80 stream processors, 8 unidades de renderização, o mesmo UDV3 que oferece suporte à decodificação de vídeos 1080p MPEG-2, VC1 e H.264 via hardware e suporte ao DirectX 11. As GPUs nos diferentes modelos diferenciam-se apenas em relação às frequências de operação, de acordo com o envelope térmico sob o qual cada modelo trabalha.

Além das tarefas de renderização e decodificação, a GPU é também compatível com o OpenCL e o DirectCompute, o que permite que aplicativos otimizados tirem proveito do poder de processamento da GPU em tarefas computacionais. Por enquanto, aplicativos otimizados ainda são raros, limitados principalmente a aplicativos científicos, ferramentas de compressão de vídeo e áudio e alguns aplicativos específicos, como o IE 9 e o Power Point 2010. Esta é ainda uma nova fronteira para os desenvolvedores, já que uma GPU oferece recursos completamente diferentes dos processadores, exigindo o desenvolvimento de código extremamente paralelístico, por isso pode ainda demorar muitos anos até que tenhamos uma boa base de aplicativos. Por enquanto, o mais importante é ainda a decodificação de vídeos via hardware, já que além de vídeos e discos Blu-Ray, a função já é suportada por navegadores e plug-ins, que usam a GPU em vez da CPU para a decodificação de vídeos via streaming, reduzindo a utilização do processador e economizando energia. 

Em jogos, a GPU é sensivelmente mais rápida que a dos antigos Core i5 baseados no Clarkdale e Arrandale e consegue competir mesmo com a GPU do Sandy Bridge. Usando um E-350, por exemplo, é possível jogar o CoD Modern Warfare 2 com nível médio de detalhes e 1366×768 a uma média de 21 FPS, ou obter uma média de 35 FPS no Left 4 Dead 2 nas mesmas condições. A principal questão é que o baixo clock do processador torna-se o gargalo antes da GPU na maioria dos títulos, limitando a lista de compatibilidade, especialmente no caso do Ontario (serie C) onde os clocks são muito baixos. Por outro lado, tanto o desempenho quanto a GPU superam por uma grande margem qualquer netbook baseado no Atom, o que era o objetivo primário da AMD.

Apesar de todo o espaço ocupado pela GPU, o Brazos ocupa uma área total de apenas 75 mm² (fabricado a 40 nm), que é menos até do que o ocupado pelo Atom Pineview. Esta é uma grande vantagem para a AMD, já que torna o Brazos bastante barato de se produzir.

04

O Zacate ou Ontario trabalham em conjunto com o Hudson FCH (Fusion Controller Hub), que faz o papel de chipset, oferecendo 6 portas SATA 600, 14 portas USB 2.0, 4 linhas PCIe 2.0, áudio e outras interfaces. O Hudson é um chip relativamente econômico, que é produzido em uma técnica de 65 nm e tem um TDP de 4.7 watts, que é uma boa marca para um chipset moderno.

Além de ser encontrado em vários modelos de netbooks, o Brazos deu origem a uma classe intermediária de notebooks ultracompactos (que são uma opção de baixo custo aos ultrabooks) e também modelos de baixo custo. Um bom exemplo é o ASUS K43U, um notebook com tela de 14″ que possui variações baseadas em vários processadores da linha, do C-50 ao E-350. Ele não é muito leve (2.6 kg), mas oferece uma boa autonomia, tem uma boa construção e chega a ser vendido por menos de R$ 1000:

06

Além dos notebooks, o Zacate pode ser encontrado em algumas placas mini-ITX, que são uma boa opção para media-centers e nettops. Um bom exemplo é a MSI E350IS-E45, uma placa baseada no AMD E-350 que oferece uma plataforma completa, já incluindo o processador e cooler. Basta instalar os módulos de memória, HD e fonte e você tem um PC completo:

 

07

Ela oferece um slot PCIe x16 (com apenas 4 linhas de dados), conectado à interface PCIe x4 do Hudson, 2 portas USB 3.0 (cnectadas a um controlador da NEC), 6 portas USB 2.0, dois slots de memória e saídas de vídeo HDMI e VGA, suportando o uso de dois monitores.

Um dos pontos fracos da plataforma é que a AMD optou por incluir um controlador de memória DDR3 single-channel. Isso ajudou a manter o consumo elétrico sob controle, mas em troca reduziu a banda disponível para as CPUs e GPU, limitando o desempenho da plataforma em jogos e aplicativos que estressem ambos simultaneamente. Diferente de outras plataformas atuais, você não precisa se preocupar em usar dois módulos, já que de qualquer forma o barramento com a memória continuará sendo de apenas 64 bits.

Além das séries E e C, existe também o AMD Z-01, uma versão de baixo consumo do C-50, que mantém os mesmos dois núcleos a 1.0 GHz e a mesma Radeon HD 6250 a 280 MHz, mas opera dentro de um TDP mais baixo, de apenas 5.9 watts. Ele é um processador destinado a tablets, que pode ser encontrado em alguns modelos, como o MSI WindPad 110W, que roda o Windows 7. Diferente da Intel, a AMD ainda não tem planos de competir diretamente com os chips ARM nos tablets com o Android, preferindo se limitar a uma tímida participação nos tablets rodando o Windows 7 e a versão x86 do Windows 8.
 

Sobre o Autor

Avatar de Carlos E. Morimoto
Redes Sociais:

Deixe seu comentário

X