A China acaba de reescrever o topo da hierarquia do poder computacional global. O LineShine, supercomputador instalado no National Supercomputing Centre in Shenzhen (NSCS), desbancou o norte-americano El Capitan e assumiu a primeira posição da lista Top 500, tornando-se a primeira máquina da história a sustentar mais de 2 ExaFLOPS de desempenho em precisão dupla (FP64) usando exclusivamente CPUs. O feito não é apenas técnico: é um sinal geopolítico construído em silício doméstico.
2,198 ExaFLOPS só com CPUs: o que esse número realmente significa
No benchmark Linpack, o LineShine registrou 2,198 FP64 ExaFLOPS, marca que nenhum sistema havia alcançado antes sem recorrer a aceleradores dedicados, como GPUs ou XPUs. A máquina foi construída pelo Shenzhen Cloud Computing Center com processadores semi-custom LX2 de 304 núcleos baseados na arquitetura Armv9, operando a 1,55 GHz. No total, o sistema mobiliza 13,79 milhões de núcleos interligados por uma rede proprietária chamada LingQi, consumindo 42,2 MW de energia.
A organização interna do LX2 é cirúrgica: dois chiplets de computação por processador, 304 núcleos divididos em oito clusters de 38 núcleos cada. Cada núcleo carrega unidades Arm SVE (Scalable Vector Extension) e SME (Scalable Matrix Extension), que aceleram operações vetoriais e matriciais com suporte a FP64, FP32, BF16, FP16 e INT8. A arquitetura de memória é igualmente incomum: 32 GB de HBM on-package, entregando até 4 TB/s de largura de banda, combinados a até 256 GB de DDR5 externo, equilibrando throughput bruto e capacidade total.
Eficiência energética e a sombra do El Capitan
Na métrica de desempenho por watt, o LineShine entrega 52,07 GFLOPS/W, número inferior aos 60,94 GFLOPS/W do El Capitan, que ainda detém vantagem nesse quesito graças aos seus aceleradores. Ainda assim, o desempenho por watt do supercomputador chinês deixa distante o Fugaku, japonês e também CPU-only, que oscila entre 14,78 e 16,84 GFLOPS/W. A comparação com o Fugaku é relevante porque reposiciona o LineShine como um salto de geração no paradigma de HPC sem aceleradores.
O sistema também alcançou o topo do ranking HPCG com 22,00 HPCG-PFLOPS. O ponto fraco aparece no HPL-MxP: apenas 7,92 EFLOPS em precisão mista, colocando o LineShine atrás do El Capitan, do Frontier e do Aurora nesse quesito. O motivo está no LX2 em si: o ganho ao passar de FP64 para precisão mista é de apenas 3,6x, bem abaixo do que sistemas com aceleradores integrados, como o AMD Instinct MI300A ou o Intel Ponte Vecchio, conseguem entregar. Limitações de largura de banda de memória para cargas mistas, maturidade de software e eficiência do interconect LingQi nesse contexto são fatores apontados como responsáveis pela diferença. A fonte ressalva, porém, que ainda é cedo para tirar conclusões definitivas sobre o desempenho do LX2 em cargas de precisão mista.
O detalhe que vai além dos benchmarks
A performance em FP64 seria notícia por si só, mas o aspecto mais revelador desse resultado está na decisão do NSCS de submeter os dados ao Top 500. Organizações que participam da lista expõem seus sistemas ao escrutínio técnico internacional, e essa escolha indica que o NSCS tem confiança de que o LineShine opera integralmente sobre tecnologia doméstica, fora do alcance de restrições de exportação impostas pelo governo norte-americano. O supercomputador não usa hardware que Washington possa cortar da cadeia de suprimentos chinesa.
Quando as restrições à exportação de chips avançados para a China se intensificaram, a aposta de Pequim em desenvolver uma cadeia de HPC independente parecia, para muitos analistas, ambiciosa demais para o curto prazo. O LineShine é a resposta empírica a esse ceticismo. O desafio agora não é técnico, mas estratégico: o sistema ainda não compete de frente com os líderes ocidentais em cargas de IA de larga escala, onde precisão mista e throughput de baixa precisão são decisivos. Para o ecossistema de HPC global, porém, a mensagem está clara: a corrida pelo exascale ganhou um novo protagonista que não depende de TSMC, NVIDIA ou Intel para seguir avançando.
Fonte: Tom’s Hardware
Você também pode gostar dos artigos abaixo:
A estratégia de Google e Amazon para disputar com a NVIDIA o mercado de chips de IA
Advogado é punido por usar comandos ocultos para influenciar IA em ação judicial
