Refrigeração dentro do chip: a solução radical para o calor gerado pelos chips para IA

Cientistas do KAIST criam chip de IA com resfriamento interno por água, capaz de dissipar calor extremo com eficiência inédita.

A maior limitação da inteligência artificial já não são apenas os algoritmos ou o número de processadores. Cada vez mais, é o calor. Os chips de IA mais potentes geram quantidades tão grandes de energia térmica que o resfriamento convencional está atingindo seus limites. Cientistas coreanos apresentaram uma solução radical, porém muito interessante: eles querem resfriar o chip por dentro.

A equipe do KAIST desenvolveu um sistema no qual canais microscópicos para fluidos são incorporados diretamente em um chip de silício. Água comum à temperatura ambiente flui pelos canais, mais finos que um fio de cabelo humano , removendo o calor onde ele é gerado. Nos testes, o sistema dissipou mais de 2.000 W/cm² e manteve a temperatura do chip abaixo de 100 °C.

A IA não apenas conta. Acima de tudo, a IA aquece.

Os centros de dados construídos para inteligência artificial hoje em dia se assemelham a fornos industriais de computação. Centenas ou milhares de aceleradores operam simultaneamente, consumindo quantidades enormes de energia e convertendo grande parte dela em calor. Esse calor precisa ser dissipado imediatamente, pois um chip superaquecido fica mais lento, instável ou danificado.

Expansão de centros de dados trava nos EUA após alta de 267% na energia

Por isso, a corrida da IA ​​há muito tempo é mais do que apenas uma corrida por melhor tecnologia de processamento, memória mais rápida e modelos maiores. É também, acima de tudo, uma corrida pelo resfriamento. Se o calor não puder ser removido de um sistema, seu desempenho não poderá ser aumentado com segurança. Isso coloca até mesmo o melhor projeto de processador sob estresse térmico.

É exatamente esse o problema que os cientistas do KAIST estão tentando resolver. Em vez de adicionar dissipadores de calor cada vez maiores, placas de resfriamento ou trocadores de calor externos, eles decidiram abordar a questão de forma diferente e mover o resfriamento o mais próximo possível da fonte de calor. Não ao lado ou acima do chip, mas diretamente dentro dele.

A solução baseia-se no chamado resfriamento por microcanais em manifold , uma rede de canais microscópicos por onde circula o fluido refrigerante . A ideia em si não é nova, mas os projetos anteriores apresentavam uma desvantagem significativa. A água tinha que percorrer longas distâncias através de canais muito estreitos, o que aumentava a resistência ao fluxo e exigia mais energia para bombeá-la.

O KAIST resolveu esse problema usando uma estrutura semelhante a uma rede de distribuição. Em vez de circular o líquido refrigerante por um longo corredor, o sistema o divide em vários caminhos mais curtos, alimentando-o por múltiplas entradas e extraindo-o por múltiplas saídas. Como resultado, a água flui de maneira mais uniforme, a resistência é reduzida e a temperatura do chip é distribuída de forma mais constante. Isso é especialmente importante em grandes sistemas de IA, onde pontos quentes localizados podem comprometer o desempenho de todo o processador.

O resultado é realmente impressionante.

O experimento utilizou um chip de teste de silício com um sistema de resfriamento integrado. O sistema foi capaz de dissipar calor superior a 2000 W/cm² utilizando resfriamento a água monofásico. Simultaneamente, a temperatura da junção foi mantida abaixo de 100 °C. Ainda mais interessante é o COP (Coeficiente de Desempenho). A equipe alcançou um valor de 106.000. Na prática, isso significa que uma enorme quantidade de calor poderia ser extraída com muito pouca energia de bombeamento. De acordo com o KAIST, esse resultado é cerca de 10 vezes melhor do que o melhor resultado anterior, divulgado há alguns anos.

Em centros de dados, a energia usada para refrigeração é energia que não pode ser alocada para computação. Portanto, se a mesma quantidade de calor puder ser removida com um consumo significativamente menor de energia por bombas e toda a infraestrutura de refrigeração, a manutenção de fazendas de IA se torna simplesmente mais fácil e barata.

Ainda está longe da implementação comercial.

Embora essa solução prometa ser realmente empolgante, devemos lembrar que se trata apenas de um protótipo. Os cientistas demonstraram resultados muito promissores em um sistema de teste, mas o caminho para a produção em massa é longo. Ainda precisamos verificar, entre outras coisas, a confiabilidade do sistema, a estanqueidade, a capacidade de produção em larga escala, a facilidade de manutenção e a durabilidade para operação a longo prazo em condições reais.

O maior desafio agora será a integração. Em um data center, você não resfria um único chip isoladamente. É preciso resfriar servidores inteiros, racks, bombas, trocadores de calor e sistemas de chão de fábrica. O resfriamento interno de silício deve, portanto, se integrar à infraestrutura maior, e não apenas impressionar com suas especificações técnicas.

Você também deve ler!
Postado por
Editor-chefe no Hardware.com.br/GameVicio Aficionado por tecnologias que realmente funcionam. Segue lá no Insta: @plazawilliam Elogios, críticas e sugestões de pauta: william@hardware.com.br
Siga em:
Compartilhe
Deixe seu comentário
Assine nossa Newsletter
Assine nossa newsletter e receba nossa seleção de conteúdo sobre tecnologia, games, IA e internet em seu email.
Veja também
Publicações Relacionadas
Img de rastreio
Localize algo no site!