Definição de Nehalem

Por Carlos E. Morimoto. Há .

O Nehalem representa a próxima arquitetura Intel, ainda produzida usando a técnica de 45 nanômetros, mas com diversas mudanças arquiteturais em relação ao Penryn. Ainda se sabe relativamente pouco sobre ele, de forma que vou me limitar a comentar as informações que já estão mais ou menos confirmadas. Enquanto escrevo, o projeto ainda não está sequer finalizado e é tratado como segredo de estado dentro da Intel. Se não houverem atrasos, as primeiras unidades do Nehalem devem chegar ao mercado no final de 2008, mas não espere que ele se popularize antes da segunda metade de 2009.

Ao contrário do Yorkfield, produzido pela combinação de dois Penryns, com dois núcleos cada um, o Nehalem será um processador quad-core nativo. Ele adotará dois recursos que até então eram exclusividade dos processadores AMD: um controlador de memória integrado (DDR3) e um barramento rápido (similar ao HyperTransport) para interligar os núcleos do processador e também ligá-lo ao chipset.

Um detalhe importante sobre o controlador de memória é que além do tradicional suporte a dual-channel, estão em desenvolvimento também versões "tri-channel" e "quad-channel", com acesso simultâneo a até 4 módulos simultaneamente, alargando o barramento com a memória de forma a melhor atender os 4 núcleos. As quad-channel estarão inicialmente restritas aos servidores, mas pode ser que a Intel utilize o sistema em alguma série destinada a entusiastas (como os Core 2 Extreme). A questão é que usar 4 módulos de memória é muito custoso e o ganho de desempenho em relação a utilizar apenas dois tende a ser pequeno, de forma que não devemos ver o recurso se popularizar nos PCs domésticos em um futuro próximo.

Assim como o Conroe e o Penryn, o Nehalem utilizará um sistema de cache compartilhado, onde todos os núcleos possuem um cache comum. Ainda não está claro se será mantida a arquitetura atual, onde cada núcleo possui um cache L1 próprio e o cache L2 é compartilhado, ou se será adotado um cache de 3 níveis, onde cada núcleo possui um pequeno cache L2 próprio e um grande cache L3 é compartilhado por todos.

Ao contrário do deselegante Kentsfield, onde todos os núcleos operam sempre à mesma freqüência e usando a mesma tensão, o Nehalem oferecerá um sistema de gerenciamento independente, onde cada núcleo pode operar a uma freqüência condizente com seu nível de utilização. Dentro deste conceito, a idéia do cache de três níveis, onde cada núcleo possui caches L1 e L2 exclusivos me parece fazer mais sentido, pois permite que os núcleos não-utilizados, ou mesmo o próprio cache L3 (que consumiria boa parte da energia do processador) sejam completamente desligados, sem prejuízo para o desempenho dos núcleos que continuarem ativos.

Podemos esperar uma configuração similar à do Athlon X2, onde temos um único controlador de memória, compartilhado entre todos os núcleos e uma interface de gerenciamento encarregada de distribuir a carga entre eles e monitorar o nível de carregamento de cada um.

Buscando melhorar o aproveitamento dos 4 núcleos e maximizar o desempenho do processador nos momentos de inatividade, em que apenas um ou dois deles estiverem ativos, o Nehalem utilizará uma versão aperfeiçoada do Hyper-Threading, introduzido na época do Pentium 4.

O Nehalem utilizará uma arquitetura mais modular, o que facilitará o desenvolvimento de versões com mais ou menos núcleos. Além da versão com 4 núcleos, existirão versões com 2 núcleos e 8 núcleos, embora ainda não esteja claro se a versão com 8 núcleos será um design octo-core "nativo", ou se será a combinação de dois processadores quad-core dentro do mesmo encapsulamento.

Além da questão do gerenciamento de energia, a arquitetura escalável do Nehalem permitirá o lançamento de versões mais simples, com apenas 1 ou 2 núcleos, que podem ser usadas nas linhas de processadores de baixo custo. É de se esperar que, caso realmente lançada, a versão com apenas 1 núcleo não seja destinada a desktops, mas sim a sistemas móveis como os UMPCs e MIDs. Como de praxe, serão lançadas versões com configurações variadas de cache, de acordo com o preço e o público-alvo, como atualmente.

A Intel divulgou também planos para produzir versões do Nehalem com aceleradores gráficos integrados, de forma similar ao Fusion da AMD. O principal problema é que, ao contrário da AMD (que agora possui a ATI), a Intel não possui sequer um acelerador gráfico competitivo. A Intel poderia desenvolver uma versão um pouco mais rápida do GMA3500 (o vídeo onboard utilizado no chipset G53) e integrá-la ao processador ao invés de no chipset, mas isso não seria uma grande evolução, já que o desempenho do vídeo integrado continuaria sendo baixo.

No final de 2009 ou (mais provavelmente) início de 2010 está previsto o lançamento do Westmere (também chamado de Nehalem-C), uma versão aprimorada do Nehalem, produzido usando a técnica de 32 nanômetros que sucederá a de 45 nanômetros usada no Penryn. Ele será sucedido pelo Sandy Bridge (anteriormente chamado Gesher), uma nova arquitetura, sobre a qual pouco se sabe além de vagos anúncios que dão a entender que ele possuirá 8 núcleos nativamente, onde cada núcleo possuirá cache L1 e L2 próprios e todos compartilharão um grande cache L3 (o que reforça a tese do uso do design de 3 níveis no Nehalem) e de que ele será capaz de operar a 4.0 GHz ou mais.

Essa última informação merece uma análise mais cuidadosa, pois 4 GHz não está muito acima dos processadores atuais. Como as versões iniciais do Penryn operarão na faixa dos 3.2 GHz, a meta de 4 GHz para o Sandy Bridge (que está duas gerações à frente) mostra que a própria Intel não acredita mais em grandes aumentos na freqüência de operação das próximas famílias de processadores e está por isso investindo no desenvolvimento de projetos com 4 e 8 núcleos, além do desenvolvimento de novos conjuntos de instruções (como o SSE4), novos compiladores e outras ferramentas que facilitem o desenvolvimento de softwares capazes de extrair ganhos reais de desempenho dos novos processadores.

Uma coisa que está clara é que softwares não-otimizados, categoria que engloba a grande maioria dos programas que utilizamos hoje em dia, não rodarão muito mais rápido em um Nehalem ou Sandy Bridge do que rodam atualmente em um Core 2 Duo overclocado para 3.0 GHz ou mais. Será necessária toda uma safra de novos softwares para que o potencial de designs com 8 cores, como o Sandy Bridge, possa ser completamente explorado.

Com o Sandy Bridge, já estamos em 2011. A partir deste ponto as informações oficiais acabam e passamos a depender apenas de especulações. Duas tendências que poderia antecipar, com uma razoável margem de certeza, são a introdução de uma técnica de fabricação de 22 nanômetros (0.022 micron) em algum ponto entre 2011 e 2013 e a introdução de chips "modulares", construídos a partir da combinação de um grande número de processadores x86, derivados da arquitetura do Nehalem e chips especializados em funções específicas, como processamento de vetores, unidades de processamento 3D (que complementarão, ou substituirão as placas 3D dedicadas) e assim por diante.

Uma amostra deste "admirável mundo novo" foi a demonstração de um chip com 80 núcleos dada pela Intel em fevereiro de 2007, desenvolvido com o objetivo de oferecer 1 teraflop de poder de processamento. Cada um dos 80 núcleos é um chip relativamente simples, otimizado para processar instruções de ponto flutuante. Cada chip possui um "roteador" que o interliga aos vizinhos. Esta estrutura permite que as instruções sejam distribuídas entre os núcleos de forma bastante similar ao que acontece dentro de um cluster com várias máquinas. A principal diferença é que tudo é feito dentro de um único chip.

Veja também
Threads alcança 150 milhões de usuários mensais
Threads alcança 150 milhões de usuários mensais
Mobile
Já dá para baixar o app do Gemini para Android no Brasil. Saiba como!
Já dá para baixar o app do Gemini para Android no Brasil. Saiba como!
Mobile
Steam muda as regras de reembolso para jogos em acesso antecipado
Steam muda as regras de reembolso para jogos em acesso antecipado
Games
Quais as diferenças entre Smartband e Smartwatch?
Quais as diferenças entre Smartband e Smartwatch?
Artigos
Console portátil apenas para jogar Pinball? Um designer imaginou como seria
Console portátil apenas para jogar Pinball? Um designer imaginou como seria
Games
Dois relógios G-Shock inspirados em League of Legends chegam ao Brasil; saiba o preço
Dois relógios G-Shock inspirados em League of Legends chegam ao Brasil; saiba o preço
Notícias
true