Penryn

O Penryn é o sucessor direto do Conroe, cujo lançamento está previsto para o início de 2008. Ele será o primeiro processador Intel produzido usando a nova técnica de 45 nanômetros (0.045 micron), que está em desenvolvimento desde 2001.

Ele deve ser visto como uma evolução do Conroe e não como um novo processador. Imagine que o Penryn está para o Conroe assim como o Pentium 4 Northwood (0.13 micron) está para o antigo Willamette, produzido usando a antiga técnica de 0.18 micron.

O Penryn é composto por nada menos do que 410 milhões de transístores. Apesar disso, ele ocupa uma área de apenas 107 mm², sensivelmente menor que o Conroe (que ocupa 143 mm²). Ele continua sendo um processador dual-core, onde cada núcleo possui 64 KB de cache L1 e ambos utilizam um grande cache L2 compartilhado. A mudança mais visível é a adição de mais 2 MB de cache L2, totalizando 6 MB (agora com 24 linhas de associação), mas ele inclui também outras melhorias.

A primeira é a adição de mais um conjunto de instruções, o SSE4. Com a popularização dos processadores dual-core e quad-core, um dos maiores desafios passou ser otimizar os softwares, de forma que eles passem a se beneficiar dos núcleos adicionais. Um dos principais objetivos do SSE4 é oferecer instruções que permitam utilizar todos os núcleos do processador de forma mais eficiente, complementando os conjuntos de instruções anteriores.

Assim como o Conroe, o Penryn não conta com um controlador de memória integrado, por isso a Intel recorreu a um novo aumento na freqüência do FSB para arejar o barramento com a memória. Além das versões com bus de 1066 MHz e 1333 MHz, serão lançadas versões com bus de 1600 MHz (4x 400 MHz), já suportado extra-oficialmente por muitas placas soquete 775. Inicialmente, o bus de 1600 MHz será utilizado por uma versão do Xeon baseada no Penryn, mas a partir de um certo ponto ele será utilizado também nas versões desktop.

Por manter o uso do soquete 775, ele será, a princípio, compartível com as placas atuais, mas ainda não está claro até que ponto. Vale lembrar que toda a safra inicial de placas soquete 775 são incompatíveis com os processadores Core 2 Duo devido a deficiências no regulador de tensão.

Na questão do consumo elétrico, a principal novidade é a introdução do “Deep Power Down Technology” um novo estágio de baixo consumo (batizado de C6), que permite que o processador consuma consideravelmente menos energia enquanto ocioso. Este recurso estará disponível apenas para as versões mobile, mas ainda assim é interessante entender como ele funciona.

Ao entrar no modo C6, o sinal de clock é desligado, a tensão é reduzida drasticamente e os caches L1 e L2 são desligados. Neste modo, o chipset continua oferecendo acesso à memória para os demais periféricos do sistema, permitindo que diversas funções continuem acessíveis, sem que o processador precise ser acordado.

O maior problema é que o processador demora um tempo relativamente longo para retornar do estado C6, já que perde todos os dados armazenados nos caches, de forma que ele é reservado para situações em que o processador fique ocioso por longos períodos. Na maior parte do tempo ele chaveia entre os modos atuais de gerenciamento, onde o tempo de recuperação é menor.

O Penryn inclui também algumas melhorias nas unidades de execução, com destaque para o processamento de instruções de divisão, usadas por diversos aplicativos gráficos e de renderização 3D e uma versão aperfeiçoada do Intel VT, que promete oferecer (finalmente) ganhos tangíveis de desempenho no VMware e outros softwares de virtualização.

Um recurso interessante do ponto de vista técnico é o EDAT (Enhanced Dynamic Acceleration Technology), que permite melhorar o desempenho do processador em aplicativos que não são capazes de se beneficiar do segundo núcleo. A idéia é bastante original: desligar o segundo núcleo (que de qualquer forma não seria utilizado pelo programa) e aproveitar a redução na dissipação térmica para fazer um overclock temporário do núcleo ativo, permitindo assim um ganho real de desempenho. O sistema pode então escolher entre manter os dois núcleos ativos a “100%” da capacidade, ou manter apenas um, trabalhando a “120%” da capacidade, de acordo com o aplicativo em uso. Inicialmente o EDAT será usado apenas nas versões mobile do Penryn, mas é de se esperar que ele seja incorporado em alguma revisão futura do Penryn para desktops caso se mostre realmente útil.

Esta foto divulgada pela Intel dá uma amostra da organização dos componentes internos do Penryn. Veja que, somados, os caches L2 e L1 ocupam mais de 60% da área do processador:


Penryn

Embora o Penryn seja um processador dual-core, dois chips podem ser combinados para formar processadores quad-core (assim como o Kentsfield), que contarão com generosos 12 MB de cache L2. A versão “simples”, com dois núcleos, é chamada de Wolfdale, enquanto a versão quad-core (dual-chip) responde pelo codenome Yorkfield.

Por outro lado, é improvável que o Penryn receba uma versão single-core, como o Conroe-L, pois o chip já é relativamente pequeno. Segundo todas as informações divulgadas até agora, é quase certo que a produção dos Celerons single-core, baseados no Conroe-L, continue ao longo de 2008 e a partir de um certo ponto a linha seja descontinuada, dando origem a versões de baixo custo do Core 2 Duo baseado no Penryn, com clock mais baixo e parte do cache L2 desativado. Se as promessas se concretizarem, em 2009 a Intel terá abandonado a produção de processadores single-core para desktops e notebooks, passando apenas a produzir processadores dual-core e quad-core.

Uma observação importante é que, embora o lançamento do Penryn esteja planejado para o início de 2008, ele levará vários meses para se popularizar, como toda nova arquitetura. Inicialmente a Intel produzirá o novo processador em quantidades limitadas e a partir daí irá aumentar a produção gradualmente, conforme for capaz de refinar a técnica de produção de 45 nanômetros.

Embora não esteja diretamente relacionado ao Penryn, este slide da Intel mostra essa questão da produção usando novos processos de fabricação:


Índice de defeitos nas diferentes técnicas de produção (Intel)

As primeiras levas de waffers produzidas em cada nova técnica de produção são basicamente imprestáveis. O índice de defeitos é tão alto que praticamente nenhum processador é utilizável. No caso da Intel, os primeiros waffers são usados para produzir células de memória SRAM, que por serem cópias da mesma estrutura básica, são mais fáceis de produzir.

Ao longo dos primeiros meses, o maquinário vai sendo calibrado, impurezas são removidas do ambiente e problemas de produção são resolvidos, fazendo com que o índice de defeitos caia rapidamente, embora ainda permaneça em níveis muito altos.

A partir de um certo ponto, é possível produzir alguns processadores utilizáveis, que são usados em sistemas de demonstração, fornecidos para review e assim por diante. Mas, é geralmente só depois de um ano e meio que torna-se viável iniciar a produção em larga escala. O volume de produção vai então crescendo gradualmente, conforme os últimos problemas são resolvidos, fazendo com que os processadores produzidos na nova técnica de fabricação convivam com os da antiga por um período relativamente longo.

Dois recursos bastante enfatizados pela Intel na transição para o processo de 45 nanômetros são o “high-k dielectric” e o “metal gate electrode”, abreviados como HK e MG.

O high-k dielectric consiste no uso de uma fina camada de um material baseado no elemento Háfnio (número 72 da tabela periódica) que possui uma constante dielétrica superior (high-k) ao do dióxido de silício, tradicionalmente utilizado na camada inferior do pólo central (gate) de cada transístor.

Esta camada é chamada de gate dieletric e tem a função de separar o emissor e o coletor, os dois pólos do transístor, evitando que a corrente flua enquanto o transístor está desligado. Conforme o transístor fica menor, a camada fica mais fina e torna-se menos eficiente, fazendo com que cada vez mais energia seja desperdiçada. O uso do high-k dielectric reduz o problema, permitindo que o processador opere a freqüências mais altas, consumindo menos energia.

O metal gate electrode consiste em substituir o gate electrode, a camada superior do pólo central do transístor (que vai logo acima do gate dieletric) por uma fina camada metálica, que melhora a condutividade do gate quando o transístor está aberto. Isto reduz o volume de energia necessária para mudar o estado do transístor, permite que ele chaveie de forma mais rápida (o que permite que o processador seja capaz de operar a freqüências mais elevadas) e permite que trabalhe utilizando uma tensão mais baixa, o que também ajuda a reduzir o consumo elétrico.

Se pudéssemos cortar uma fatia muito fina do wafer de silício do processador e isolar a área referente a um único transístor, você veria uma estrutura similar a este diagrama, onde o emissor (positivo) e o coletor (negativo) do transístor são separados pelo gate, onde temos as duas camadas:


Diagrama mostrando o uso do high-k e metal gate

A combinação dos dois recursos é chamada pela Intel de “HK+MG” e serve para basicamente melhorar a eficiência geral dos transístores, permitindo que menos corrente passe quando o transístor está fechado e mais corrente passe quando ele está aberto.

Estima-se que a transição para o processo de 45 nanômetros gere uma redução de até 30% na energia necessária para mudar o estágio dos transístores e que a combinação do high-k dielectric e o metal gate electrode torne o chaveamento dos transístores até 20% mais rápido, além de uma redução de até 80% no gate-leakage (o desperdício de energia que cresce exponencialmente conforme aumenta a freqüência de operação do processador), o que representa uma boa vantagem competitiva para Intel.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X