A nVidia é uma empresa tradicionalmente associada às placas 3D. Ela já foi a maior no setor, se defendendo dos ataques da ATI, SiS, Intel e outras. Entretanto, ela começou a entrar em declínio com a compra da ATI pela AMD, que passou a investir mais pesado no desenvolvimento e fabricação de GPUs, fazendo com que a nVidia perdesse espaço. Para complicar, o próprio mercado das GPUs dedicadas está sendo ameaçado pelo Sandy Bridge e das APUs da AMD, que embora não sejam tão poderosos quanto uma GPU dedicada, oferecem um desempenho “bom, o bastante” para jogadores ocasionais, o suficiente para convencer muitos a deixar de comprar uma GPU dedicada.
Percebendo o declínio de seu principal negócio, a nVidia passou a investir em duas frentes. A primeira é o mercado de HPC (supercomputadores), onde as GPUs oferecem diversas vantagens competitivas em relação às CPUs. Embora as coisas estejam indo mais devagar que os acionistas gostariam, a nVidia já conseguiu algumas vitórias no setor, como o Tianhe-1A, um supercomputador composto por 7.168 GPUs nVidia Tesla M2050 (combinadas com 14.336 CPUs), que oferece 2,507 petaflops de processamento bruto.
A segunda frente é o lançamento de SoCs baseados em processadores ARM, destinados a smartphones, tablets e outros dispositivos móveis, que podem se tornar o principal ganha-pão da empresa nos próximos anos.
A primeira investida foi feita em 2008, com o lançamento do nVidia Tegra, que combinava um processador ARM11 com uma GPU bastante poderosa, que além do forte desempenho 3D era capaz de gravar e exibir vídeos 720p com processamento via hardware, suporte a câmeras de até 12 MP, suporte a saída HDMI e assim por diante. Embora ele fosse um pouco fraco em processamento (devido ao uso de um ARM11 em vez de um Cortex A8 ou similar como nos SoCs usados hoje em dia), ele apresentava um conjunto de recursos muito fortes para a época. Entretanto, ele acabou sendo ignorado pelos fabricantes de smartphones, devido à decisão da nVidia em atrelar fortemente o desempenho do chip ao Windows Mobile, em uma época em que o interesse dos fabricantes já estava no Android.
No início de 2010, a nVidia apresentou o Tegra 2, um chip muito mais poderoso, que combina dois processadores ARM Cortex-A9 com uma GPU duas vezes mais poderosa que a do Tegra original, que oferece um desempenho superior ao dos concorrentes diretos (de 20 a 30% mais rápido que o PowerVR GSX540 do iPhone 3GS e de 25 a 100% mais rápido que o Snapdragon Adreno) e é capaz de decodificar vídeos 1080p via hardware. Apesar do anúncio de 2010, o Tegra 2 acabou chegando efetivamente ao mercado apenas agora no início de 2011 (devido à demoras nas etapas finais de desenvolvimento, produção e desenvolvimento de projetos por parte dos fabricantes de smartphones) mas ele já chegou como um forte concorrente.
O Cortex A9 é um processador bem diferente do Corte A8 usado nos aparelhos atuais. À primeira vista, a principal novidade é o suporte à multiprocessamento, que permite o desenvolvimento de SoCs com dois ou quatro núcleos, mas ele também inclui muitas mudanças estruturais.
Com o Cortex A9, a ARM tomou um caminho similar ao dos fabricantes de PCs no final da década de 90, migrando de uma arquitetura in-order (como no Pentium e no Atom) para uma arquitetura out-of-order (como nos demais processadores atuais), mantendo o processamento de duas instruções por ciclo. A adoção de uma arquitetura fora de ordem oferece um desempenho superior (as instruções podem ser reordenadas para aproveitar melhor as unidades de processamento disponíveis) mas por outro lado ela aumenta a complexidade e reduz a eficiência energética do chip.
Para contrabalançar esses fatores, o Cortex A9 é baseado em um pipeline muito mais curto, com apenas 8 estágios (contra os 13 do Cortex A8). O uso de menos estágios reduz fortemente o consumo do chip, mais do que compensando o aumento em outras áreas, mas por outro lado limita as frequências de operação que ele é capaz de atingir. Entretanto, esse não é um grande problema no caso do Cortex A9, já que os SoCs para smartphones operam a frequências baixas, na casa dos 1.0 GHz.
Ele inclui também um buffer de ordenamento de instruções e 16 novos registradores, com 64 KB de cache L1 (32 KB para dados e 32 KB para instruções) para cada núcleo e um cache L2 de até 1 MB compartilhado entre todos.
Como comentei, o Tegra 2 inclui dois Cortex A9, equipados com um cache L2 de 1 MB e uma GPU GeForce ULV. Ela inclui 8 shader cores, mas diferente das GPUs atuais, que usam shaders unificados, ela adota uma arquitetura mais simples (similar à vista nas GeForce 7xxx) com 4 unidades de processamento de pixel shaders e 4 para o processamento de shaders, combinadas com unidades para o processamento de vértices, texturas e assim por diante:
Apesar do uso de unidades dedicadas para pixel e vertex shaders sugerir o uso de uma arquitetura antiga, este não é o caso, já que ela inclui um pixel cache e texture cache (que melhoram o desempenho e reduzem o número de operações de acesso à memória), compressão de texturas e outras funções que estrearam apenas recentemente nas GPUs para desktops. Ela também recebeu mudanças destinadas a reduzir o consumo, incluindo uma grande redução no número de estágios de pipeline
Em uma estratégia similar à adotada nos desktops, a nVidia está trabalhando juntamente com desenvolvedores de jogos para que sejam lançados títulos otimizados para o Tegra 2, com melhores gráficos e melhores efeitos de física ou mesmo o desenvolvimento de títulos exclusivos, que serão comercializados através do “Tegra Zone”, mais uma loja de aplicativos.
Além da aceleração de vídeos e o suporte à decodificação de vídeos 1080p via hardware, o Tegra 2 inclui também suporte a aceleração de vídeos e animações em Flash usando a GPU, similar ao que temos nos desktops com o Flash 10.1. Isso soluciona o problema do baixo desempenho e ameniza bastante o problema do alto consumo de bateria ao visualizar páginas com Flash, permitindo que os smartphones ofereçam uma experiência de uso mais próxima à dos desktops.
Foi incluído também um ISP (image signal processor), que melhora o desempenho da câmera, permitindo que o chip processe imagens de 12 MP em apenas 3 segundos (contra 9 a 10 segundos em outros SoCs atuais). Além de reduzir o intervalo entre as capturas e permitir que os aparelhos suportem resoluções mais altas para a captura de vídeo, ele permite a captura de várias imagens em sequência, uma possibilidade que é explorada no LG Optimus 2X, que oferece um modo burst, onde o telefone tira 6 fotos em rápida sequência.
O primeiro aparelho com o Tegra 2 a chegar ao mercado é o LG Optimus 2X, que tira proveito da maior potência do processador para oferecer uma série de melhorias em relação aos aparelhos da safra atual:
Além do melhor desempenho geral, o segundo núcleo permite que ele decodifique vídeos 1080p até mesmo via software (no caso dos codecs sem aceleração via hardware) e ofereça uma experiência de navegação bem à frente da de outros aparelhos. Você pode ver alguns benchmarks neste post do Anandtech (http://www.anandtech.com/show/4140/this-just-in-lg-optimus-2x), que coloca o Optimus 2X bem à frente em relação ao desempenho em navegação, javascript em processamento, números que serão similares em outros aparelhos baseados no Tegra 2:
A aceleração via hardware para os vídeos em Flash reduz muito o consumo da bateria e o bom desempenho da GPU o torna um potencial concorrente também para os consoles. Ele oferece uma saída HDMI (com a possibilidade de usar uma TV ou monitor para visualizar a área de trabalho, embora de forma mais limitada que no Motorola Atrix devido ao menor suporte na parte de software) e uma câmera de 8 MP, capaz de gravar vídeos Full-HD (1920×1080) a 24 FPS, graças ao ISP incluído no SOC.
A adoção do Tegra 2 está sendo surpreendentemente forte, tanto em smartphones como em tablets, o que não é de se surpreender, já que apesar da função essencial (equivalente à combinação de processador, placa 3D e chipset em um PC) o SoC representa apenas uma pequena fração do custo final em smartphones ou tablets high-end (20 ou 30 dólares, em um aparelho que custa mais de 500). Isso faz com que qualquer novo produto com reais vantagens técnicas seja adotado rapidamente pelos fabricantes.
Assim como fez no Tegra 1, a nVidia está orientando o Tegra 2 fortemente a um único sistema operacional, mas dessa vez em vez de escolherem o finado Windows Mobile, optaram pelo Android.
A ênfase da nVidia no Android é mais do que justificável, já que com exceção dele e do iOS, todos os demais sistemas operacionais móveis estão em declínio, incluindo o Symbian, o BlackBerry OS, Windows Mobile e até mesmo o Windows Phone 7, que tem enfrentado fracas vendas. Como a Apple usa um chip próprio tanto no iPhone quanto no iPad, a única oportunidade para um fabricante que está entrando agora no mercado é mesmo o Android.
Outro fator por trás da estratégia da nVidia é a ideia de que os smartphones vão começar a ser usados no lugar do PC para tarefas leves, conectados a monitores e teclados, ou a smartbooks “burros”, que serão apenas um conjunto de tela e teclado, deixando todo o processamento por conta do smartphone. Esta é uma ideia sobre a qual discorri no meu artigo de janeiro, sobre o Motorola Atrix, que é justamente baseado no Tegra 2:
https://www.hardware.com.br/artigos/smartphones-substituir-desktops/
Para a nVidia, os PCs de uso geral serão substituídos por smartphones conectados a monitores externos até o final da década, com os PCs dedicados ficando restritos ao segmento profissional e jogos mais pesados. Mesmo desconsiderando essa possibilidade, as projeções apontam um crescimento vertiginoso para o número de smartphones com o Android vendidos nos próximos anos, ultrapassando as 300 milhões de unidades anuais em 2015 (Gartner). Dado os avanços do Tegra 2, e a promessa de um Tegra 3 quad-core de 28 nm operando a 1.5 GHz para o final do ano, a nVidia tem chances reais de se tornar uma das líderes do segmento, deixando para trás as perdas no mercado de GPUs. Mesmo que que consigam apenas 20 ou 30% de participação nesse mercado, já venderão muito mais Tegras do que GPUs para desktops.
Deixe seu comentário