Xeon MP

A versão inicial do Xeon MP foi lançada em março de 2002. As versões iniciais (de 1.4, 1.5 e 1.6 GHz) eram baseadas no core Foster MP (uma versão modificada do core Foster, usada no Xeon DP), que combinava os 256 KB de cache L2 do Foster original com um cache L3 on-die de 512 KB ou 1 MB (de acordo com a versão), suporte a Hyper-Threading e o suporte a 4 ou 8 processadores. Esta versão não foi muito bem recebida, pois embora as melhorias tenham aumentado o desempenho, elas também aumentaram o custo, fazendo com que o Foster MP fosse pouco popular. Na época a AMD soube aproveitar a confusão para começar a crescer no mercado de servidores, lançando o Athlon MP, uma versão do Athlon Palomino com suporte a SMP.

Em seguida veio a versão baseada no core Gallatin, o mesmo core usado no Xeon DP, mas com suporte ao uso de 4 ou 8 processadores. Dentro da série MP, o Gallatin foi lançado em versões de 1.5 a 3.0 GHz, com de 1 a 4 MB de cache L3, todas destinadas a placas soquete 603.

A migração para as placas soquete 604 veio apenas em 2005, com o lançamento das versões baseadas no core Potomac, fabricado usando uma técnica de 0.09 micron. Ele foi usado em versões de 2.83, 3.0 e 3.33 GHz, que combinavam um cache L2 de 1 MB com um cache L3 de 4 ou 8 MB.

Em dezembro de 2005 foi lançada a primeira versão dual-core do Xeon, baseada no core Paxville, fabricado em uma técnica de 0.09 micron, que além do suporte a instruções de 64 bits, incluía 2 MB (2x 1 MB) ou 4 MB (2x 2 MB) de cache L2. Ele foi usado em uma versão solitária do Xeon DP (que operava a 2.8 GHz) e em 4 versões do Xeon MP: 7020 (2.66 MHz, 2x 1 MB), 7030 (2.8 GHz, 2x 1 MB), 7040 (3.0 GHz, 2x 2 MB) e 7041 (3.0 GHz, 2x 2 MB). Estas versões estão entre os processadores de maior consumo elétrico de toda a história, com um TDP da nada menos do que 165 watts.

Mesmo depois do lançamento dos Xeon DP baseados no core Dempsey e dos processadores Core 2 Duo (que devido ao bom desempenho passaram a ser usados em grande escala também nos servidores), o Xeon MP baseado na plataforma NetBurst ainda teve um último fôlego, com o lançamento do core Tulsa em agosto de 2006.

Embora o cache L2 tenha sido reduzido para apenas 2 MB (1 MB por núcleo), foi adicionado um generoso cache L3, com até 16 MB, usado de forma conjunta pelos dois núcleos. O grande cache L3, combinado com a possibilidade de usar até 8 processadores fez com que eles fizessem sucesso em alguns nichos, apesar do alto custo (o 7150N com 16 MB de L3 custava nada menos do que US$ 2.622 na época do lançamento).

O core Tulsa foi usado no Xeon 7110M (2.6 MHz, 2x 1 MB + 4 MB), 7110N (2.5 GHz, 2x 1 MB + 4 MB), 7120M (3.0 GHz, 2x 1 MB + 4 MB), 7120N (3.0 GHz, 2x 1 MB + 4 MB), 7130M (3.2 GHz, 2x 1 MB + 8 MB), 7130N (3.16 GHz, 2x 1 MB + 8 MB), 7140M (3.4 GHz, 2x 1 MB + 16 MB), 7140N (3.33 GHz, 2x 1 MB + 16 MB) e 7150N (3.5 GHz, 2x 1 MB + 16 MB). Os modelos da série “M” utilizam bus de 800 MT/s (200 MHz, com 4 transferências por ciclo), enquanto os da série “N” utilizam bus de 667 MT/s (166 MHz x 4), daí as pequenas diferenças de clock entre os modelos equivalentes das duas séries.

O Tulsa se manteve no mercado por quase um ano após o lançamento do Clovertown, usado nos processadores da série DP. Isso causou uma certa confusão no mercado, pois as empresas interessadas em implantar servidores com grande poder de processamento eram obrigadas a escolher entre um servidor com dois processadores Xeon quad-core da série 53xx (baseados no Clovertown) ou gastar muito mais em um servidor com 4 processadores Xeon 71xx Dual-Core baseados no Tulsa que, por serem baseados na obsoleta arquitetura NetBurst, acabavam perdendo para os 53xx na maioria das tarefas, muito embora contassem com um generoso cache L3.

O sucessor direto do Tulsa é o Tigerton, um processador quad-core anunciado em setembro de 2007 e disponível em volume a partir de novembro do mesmo ano. Embora tenha sido lançado quase ao mesmo tempo que os primeiros processadores baseados no core Penryn, de 0.045 micron, o Tigerton é ainda baseado em uma arquitetura de 0.065 micron, assim como o Clovertown. Cada processador é composto por dois processadores dual-core independentes, que compartilham o mesmo encapsulamento. Cada par possui 4 MB de cache L2 compartilhado, totalizando 8 MB.

O Tigerton é usado no Xeon E7310 (1.6 GHz, 2x 2 MB), E7320 (2.13 GHz, 2x 2 MB), E7330 (2.4 GHz, 2x 3 MB), E7340 (2.4 GHz, 2x 4 MB) e X7350 (2.93 GHz, 2x 4 MB), todos com bus de 1066 MT/s (233 MHz x 4).


Xeon E7340 (soquete 604)

Como pode ver, apenas o E7340 e o X7350 possuem os 8 MB de cache L2 completos, os demais possuem parte do cache L2 desativado em fábrica, o que permite à Intel aproveitar processadores com defeito em partes do cache. A mesma política é usada nos processadores da série 72xx, que são processadores dual-core, obtidos através da desativação de um dos dois processadores dentro do encapsulamento.

Todos os modelos das séries 73xx e 72xx utilizam o soquete 604, mas não são compatíveis com as placas usadas pelos processadores da série 71xx. Junto com o Tigerton, a Intel introduziu um novo chipset, o i7300 (Clarksboro), que entre outras melhorias implementa o uso de 4 barramentos separados, de forma que cada processador dispõe de um FSB de 1066 MT/s apenas para si, eliminando gargalos e compensando parcialmente a ausência de um cache L3. Outra mudança é o uso de memórias FD-DIMM, em substituição aos módulos registered DDR2 usados nos chipsets anteriores.

Os módulos registered incluem chips adicionais (os registradores) que funcionam como uma interface entre o controlador de memória e os chips. Eles melhoram a confiabilidade das transmissões e permitem o uso de um número maior de módulos de memória, além de possibilitarem a criação de módulos com mais chips e conseqüentemente de maior capacidade. Freqüentemente, os módulos incluem também suporte a ECC, o que adiciona uma camada de redundância, permitindo a correção de erros simples nas leituras:


Módulos registered DDR2

O uso dos chips com os registradores independem da tecnologia usada nos chips de memória, de forma que temos módulos registered DDR, registered DDR2 e assim por diante (o termo “registered” é normalmente traduzido para “registrado” mas eu pessoalmente não gosto desta tradução, por isso uso o termo original).

Os módulos registered são consideravelmente mais caros que os módulos tradicionais, principalmente os que incluem também suporte a ECC, mas, como eles oferecem um ganho considerável de confiabilidade, o aumento no custo é considerado aceitável.

As memórias FB-DIMM são uma resposta diferente para o mesmo problema. Em vez de registradores, o padrão vai um passo além e adota o uso de um barramento serial dedicado entre o controlador de memória e os módulos, substituindo o barramento paralelo compartilhado tradicionalmente usado.

Cada módulo de memória FB-DIMM inclui um controlador dedicado, chamado AMB (Advanced Memory Buffer) que funciona como um intermediário entre o controlador de memória e os chips de memória. O AMB é o responsável por toda a comunicação entre os chips e o controlador de memória, incluindo a verificação dos dados e correção de erros:


Módulo FB-DIMM

O uso do AMB reduz o volume de erros de transmissão (o que aumenta a confiabilidade) e permite o uso de um número maior de módulos de memória, sem que seja necessário aumentar os tempos de latência.

A maioria dos chipsets para micros desktop suporta até 4 módulos de memória. Chipsets para servidores que utilizam memórias registered, como o E8501 (usado pelos processadores da série 71xx) suportam em geral até 16 módulos, enquanto chipsets que utilizam módulos FB-DIMM podem, dentro do padrão, suportarem até 48 módulos, divididos em 6 canais independentes.

O chipset i7300, usado em conjunto com o Xeon Tigerton, suporta nada menos do que 32 módulos, o que possibilita o uso de nada menos do que 256 GB de memória RAM por servidor, um volume de memória impensável a até pouco tempo.

Naturalmente, os módulos FB-DIMM também possuem desvantagens. O chip AMB aumenta consideravelmente o consumo elétrico dos módulos (um módulo FB-DIMM consome aproximadamente 15 watts, contra apenas 6 a 8 watts de um módulo registered), além de aumentar a latência de acesso à memória em relação aos módulos de acesso direto que utilizamos em micros desktop.

Embora usar módulos FB-DIMM seja uma vantagem em grandes servidores, devido ao suporte a um volume maior de memória, eles acabam sendo contra-produtivos em configurações mais modestas, onde você precisa utilizar apenas dois ou quatro módulos.

Com a crescente preocupação com a redução do consumo elétricos dos servidores e a busca por componentes de maior eficiência, as memórias FB-DIMM tem um caminho difícil pela frente, já que, por melhores que sejam os projetos, o uso do AMB sempre fará com que os módulos consumam mais do que módulos de memória DDR2 e DDR3 regulares. Em um servidor com 8 módulos de memória, por exemplo, o aumento no consumo pode facilmente superar os 50 watts, o que é mais do que o consumo de um Xeon L5335 quad-core.

Enquanto escrevo (2008) os módulos FB-DIMM são usados apenas por chipsets da plataforma Intel. Nos processadores AMD Opteron o controlador de memória é incluído diretamente no processador, o que permite que cada processador possua um barramento exclusivo, cada um com seus próprios módulos de memória.

Isso permite utilizar 4 ou 8 processadores, cada um ligado a 4 ou 8 módulos de memória registered DDR2, totalizando até 64 módulos por servidor. Como temos os módulos divididos em barramentos separados, cada um controlado por um processador diferente, é possível utilizar um grande número de módulos de memória, mesmo sem utilizar módulos FB-DIMM.

Sobre o Autor

Redes Sociais:

Deixe seu comentário

X