O erro da plataforma NetBurst

Possuir o dobro de estágios significa também possuir mais transístores e consumir mais energia por ciclo de processamento. Se isso vem acompanhado de um aumento no clock, chegamos a um processador ineficiente, que consome muito mais energia e dissipa muito mais calor.

Por armazenar instruções decodificadas, o cache L1 do Pentium 4 também se tornou menos eficiente, já que instruções decodificadas ocupam mais espaço. Enquanto o Athlon possuía 64 KB (metade) do cache L1 reservado para armazenar instruções, o cache do Pentium 4 Willamette armazenava o equivalente a apenas 8 KB. Isso tornava o processador mais dependente do cache L2 (que devia ser obrigatoriamente maior, para que o processador mantivesse um bom nível de desempenho) e do barramento com a memória RAM, que deveria ser capaz de alimentar os caches.

O Pentium 4 original (core Willamette) possuía apenas 256 KB de cache L2, por isso era consideravelmente mais lento que um Athlon, ou mesmo um Pentium III do mesmo clock. O core Northwood, lançado em seguida, trouxe 512 KB de cache e o Prescott (lançado em 2004) trouxe 1 MB completo.

7aa11ec

Pentium 4 com core Prescott

O cache L2 é um item extremamente caro, pois cada bit de cache adiciona 4 ou 6 transistores ao processador, de acordo com o layout usado. Um cache L2 de 1 MB ocupa pelo menos 40 milhões de transistores, mais do que o total de transistores do Athlon Palomino (que possuída 37.5 milhões). Mais transistores tornam o processador proporcionalmente mais caro de se produzir, o que aumenta o preço de venda.

Para completar, existiu o problema das memórias Rambus, que praticamente paralisou as vendas das primeiras versões do Pentium 4 até que os chipsets com suporte a memórias SDRAM chegassem ao mercado.

Com o Pentium 4 Northwood, a Intel voltou a ser competitiva, chegando rapidamente aos 3.4 GHz. Foi introduzido também o Hyper Threading, que permitia ao Pentium 4 processar dois threads simultaneamente, simulando um processador dual-core. O plano da Intel, de compensar a baixa eficiência do Pentium 4 com frequências de clock maiores, parecia estar dando certo. Na época, o roadmap da Intel mostrava processadores Pentium 4 com core Prescott atingindo 5.2 GHz no final de 2004 e planos para o core “Tejas”, que alcançaria impressionantes 10 GHz no final de 2005.

Porém, nada disso aconteceu. Os 3.4 GHz se tornaram uma barreira difícil de transpor. A partir daí, a Intel conseguiu apenas pequenos incrementos de clock, atingindo a muito custo os 3.8 GHz com o Prescott, que além de ser produzido numa técnica de 0.09 micron, teve o pipeline esticado para um total de 31 estágios. Acima de 3.8 GHz, o gate leakage, ou seja, a eletricidade perdida pelos transistores do processador a cada ciclo, tornava o consumo e dissipação térmica altos demais.

Embora seja possível superar a barreira dos 4.0 GHz com o Prescott, via overclock, o resultado é um processador beberrão demais. É como se cada transístor do processador fosse um minúsculo cano, por onde passa água. Quanto menores os transistores, mais finos são os canos e quanto maior o clock, mais forte é a pressão da água.

Os transistores são compostos por filamentos muito finos, o que causa uma pequena perda de energia a cada chaveamento, chamada de gate leakage. É como se os canos do exemplo possuíssem pequenos furos por onde vaza uma pequena quantidade de água. Conforme o clock aumenta, a pressão se torna mais forte e cada vez mais água vaza pelos canos, gerando um desperdício cada vez maior. No caso do processador, toda a energia desperdiçada se transforma em calor, o que traz a necessidade de um cooler mais eficiente, gerando um ciclo vicioso.

Ultrapassar os 3.8 GHz com o Prescott resultava em um aumento cada vez maior no consumo e na dissipação térmica do processador, em troca de um aumento cada vez menor na frequência de operação.

O pequeno aumento no clock proporcionado pelo core Prescott serviu mais para encobrir a perda de desempenho causada pelo novo aumento no número de estágios do pipeline do que para realmente aumentar o desempenho, transformando o Prescott em um dos maiores fiascos da história da Intel.

O Cedar Mill, lançado no início de 2006, mais uma vez mostrou a dificuldade em produzir processadores Pentium 4 com clock mais alto. Mesmo produzido numa técnica de 0.065 micron, o Cedar Mill não foi capaz de superar a barreira dos 3.8 GHz. Ao invés disso, a Intel optou por produzir processadores dual core (baseados no core Presler), chegando ao Pentium Extreme Edition 965, que opera a 3.73GHz. Em resumo: em dois anos, a Intel conseguiu apenas ganhos incrementais de desempenho na plataforma Pentium 4. Caminhou bastante, porém para o lado e não para a frente.

Naturalmente, a AMD não ficou parada. Depois do Athlon Palomino e do Thoroughbred, a AMD lançou o Barton, que trouxe pequenas melhorias de projeto e 512 KB de cache L2. Além de ser usado nas versões mais rápidas do Athlon XP, o core Barton foi utilizado nos Semprons 2400+ a 3000+, os últimos processadores lançados para o saudoso soquete A.

A partir daí, tivemos os Athlon 64, Athlon 64 FX, Athlon 64 X2 e os Semprons para as placas soquete 754, 939 e AM2. Pela primeira vez na história, a AMD tomou a dianteira, produzindo processadores mais rápidos que a Intel e fazendo seu padrão de instruções de 64 bits (o AMD64) prevalecer, obrigando a Intel a desenvolver o EM64T, um conjunto compatível de instruções, incluído no Pentium 4 Prescott, sem muito alarde.

De fato, a participação da AMD no mercado só não cresceu mais neste período devido à sua incapacidade de produzir seus processadores em maior volume. Assim como é demorado desenvolver um novo projeto, também é caro e demorado inaugurar novas fábricas.

Entretanto, sendo uma empresa tão grande, a Intel pode se dar ao luxo de manter vários projetos em desenvolvimento simultaneamente, tendo um plano B à disposição caso as coisas dêem errado.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X