Como comentei no início, o Nehalem é o primeiro de uma nova série de processadores baseados na nova arquitetura, uma família que inclui diversos outros modelos, que serão lançados ao longo dos próximos meses:
Nehalem-EX: Esta é a versão destinada a servidores. Ele será um processador 8-core nativo, com 24 MB de cache L3, que suportará o uso de 2 ou 4 processadores (ou seja, até 32 núcleos por placa), tirando proveito do uso do QPI. Devido ao aumento no número de trilhas necessárias para realizar a comunicação entre os processadores, ele utilizará mais um novo soquete, o LGA1567.
Clarkdale: Esta será uma versão dual-core do Nehalem produzida usando uma técnica de 32 nanômetros e com um chipset de vídeo integrado (mais uma função movida do chipset para o processador), servindo como um substituto direto para o Pentium E e os Core 2 Duo.
Graças à técnica de produção de 32 nanômetros, tanto o custo de produção quanto o consumo elétrico serão bem mais baixos que o dos processadores atuais, o que deve levar a Inter a fazer a mudança rapidamente. A expectativa é que a Intel anuncie os primeiros processadores baseados na plataforma antes do final de 2009.
Duas observações com relação ao chipset de vídeo é que ele será um derivado do GMA X4500, usado nos chipsets atuais (e não um derivado do Lahhabee) e que ele será um chip separado incluído dentro do encapsulamento do processador e não realmente um componente interno, incluído na mesma pastilha de silício.
Arrandale: Esta é uma versão mobile do Clarkdale, também dual-core, mas com um TDP mais baixo. Ele é destinado a substituir o Core 2 Duo nos notebooks, complementando o lançamento da nova geração do Atom (baseada no Pinetrail), que avançará sobre os netbooks.
Clarksfield: Esta é a versão quad-core destinada a notebooks, também produzida usando a técnica de 32 nanômetros. A principal diferença em relação aos processadores para desktop serão o TDP e as frequências de operação bem mais baixas.
Existe uma boa dose de polêmica em torno da utilidade de um processador quad-core em um notebook, já que eles são predominantemente usados para tarefas de produtividade e alguns jogos, tarefas onde os processadores dual-core são tradicionalmente a melhor opção. Apesar disso, a Intel parece determinada a popularizar os processadores quad-core em todas as frentes, incluindo aí os notebooks.
A boa notícia é que o uso do PCU e do Turbo Boost deve garantir que os chips mantenham um desempenho e um consumo elétrico equilibrado, mesmo em aplicativos que não se beneficiam dos 4 núcleos. Em outras palavras, os dois núcleos adicionais podem não ajudar muito, mas pelo menos também não vão atrapalhar.
Gulftown: Este é o codenome do sucessor do Bloomfield, produzido usando a técnica de 32 nanômetros, destinado a placas LGA1366. Ele manterá o uso de 4 núcleos, mas trará mais cache e possivelmente outras melhorias relacionadas ao desempenho.
A migração para a técnica de 32 nanômetros resultará em transístores com pouco mais de metade do tamanho dos produzidos usando a técnica de 45 nanômetros, o que oferecerá bastante espaço para a inclusão de novos componentes. É nesse ponto que a arquitetura modular do Nahalem começará a realmente pagar dividendos.
Inicialmente o Gulftown substituirá os modelos da série XE como processador de alto desempenho, eventualmente ganhando versões mais acessíveis. Foi anunciada também uma versão com 6 cores, que deve ser lançada no início de 2010.
Estas versões de 32 nanômetros do Nehalem são coletivamente chamadas de Westmere, que é o nome código da nova plataforma, da mesma forma que o Bloomfield, Lynnfield & cia. são sub-versões dentro da família Nehalem.
Para 2010 está prevista uma versão com GPU integrada, o Sandy Bridge. Diferente do Clarkdale, onde a GPU será apenas um segundo chip dentro do encapsulamento do processador, no Sandy Bridge a GPU será movida para dentro do núcleo, resultando em uma solução muito mais elegante.
Junto com o Sandy Bridge, teremos o lançamento dos primeiros produtos baseados no Larrabee, a nova arquitetura para o processamento paralelo que a Intel vem anunciando desde 2007.
A primeira amostra da arquitetura foi a demonstração de um chip com 80 núcleos, desenvolvido com o objetivo de oferecer 1 teraflop de poder de processamento. Cada um dos 80 núcleos é um chip relativamente simples, otimizado para processar instruções de ponto flutuante. Cada chip possui um “roteador” que o interliga aos vizinhos. Esta estrutura permite que as instruções sejam distribuídas entre os núcleos de forma bastante similar ao que acontece dentro de um cluster com várias máquinas. A principal diferença é que tudo é feito dentro de um único chip:
Com o tempo, foi revelado que este chip massivamente paralelo era uma versão prévia do Larrabee, com o qual a Intel pretende entrar no ramo de placas 3D de alto desempenho, concorrendo com a nVidia e a AMD/ATI.
Assim como no caso do Atom, a inspiração para a nova arquitetura veio do antigo Pentium. Cada um dos processadores do Larrabee é essencialmente um Pentium 1 modernizado, com duas unidades de execução e a capacidade de processar 4 threads (em vez de apenas dois, como no Nehalem) em cada uma. Elas são complementadas por uma unidade de processamento de vetores, composta por 16 unidades distintas, capazes de processar instruções de ponto flutuante de 32 bits e 256 KB de cache L2, que complementam os 64 KB de cache L1. Diferente dos processadores tradicionais, que são otimizados para o processamento de instruções seqüenciais, ele é especializado em processamento paralelo, assim como os chipsets 3D.
Desenvolver uma CPU otimizada para o processamento de gráficos pode parecer estranho, mas essa é basicamente a mesma coisa que a ATI e nVidia vêm fazendo desde a introdução dos shaders programáveis, duas gerações atrás.
Ao olhar o diagrama de blocos de um G80 (usado nas GeForce 8xxx), você notará que ele é composto por 8 clusters de unidades de processamento de vetores, que são a base do chipset. Cada uma possui seu próprio cache e a comunicação entre elas é feita de uma maneira não muito diferente da que a Intel desenvolveu para o Larrabee:
Uma única unidade não ofereceria um desempenho digo de nota, mas ao combinar algumas dúzias delas (foram anunciados planos de usar de 16 a 32 unidades na geração inicial de produtos) a Intel terá em mãos um chipset de vídeo bastante poderoso.
As primeiras versões nada mais serão do que placas 3D PCI-Express regulares, que concorrerão com os lançamentos da nVidia e da ATI, mas os aceleradores devem logo substituir também os chipsets de vídeo integrado, resultando em processadores com aceleradores 3D relativamente poderosos incluídos diretamente no núcleo.
Deixe seu comentário