A busca por computadores capazes de executar modelos de inteligência artificial localmente tem levado entusiastas a montar configurações pouco convencionais. Um exemplo foi publicado no Reddit por um usuário que conseguiu instalar duas GPUs ASUS Radeon AI Pro R9700 de 32 GB em um Cooler Master NR200, gabinete Mini-ITX. O sistema reúne 64 GB de memória de vídeo (VRAM) e foi projetado exclusivamente para rodar grandes modelos de linguagem (LLMs), deixando os jogos em segundo plano.
O desafio foi colocar duas GPUs profissionais dentro de um gabinete compacto
Embora o Cooler Master NR200 seja bastante conhecido entre os fãs de computadores compactos, ele não foi projetado para acomodar duas placas de vídeo profissionais desse porte.
Para tornar o projeto possível, o usuário recorreu a um adaptador PCI Express Gen5 x16 para dois links x8/x8, utilizando bifurcação PCIe. Dessa forma, ambas as Radeon AI Pro conseguem operar simultaneamente, segundo o autor, utilizando oito pistas PCIe Gen5 para cada placa.
As fotografias publicadas mostram que praticamente todo o espaço interno do gabinete foi ocupado pelas duas GPUs, pelo cabeamento da fonte e pelo conjunto de adaptadores necessários para a instalação.
Outro detalhe é a presença de duas ventoinhas Noctua NF-A9x14 PWM, instaladas ao lado da GPU posicionada verticalmente para auxiliar no fluxo de ar.
O objetivo não é jogar, mas executar modelos de IA localmente
Ao contrário da maioria dos computadores equipados com múltiplas GPUs, esta máquina não foi montada para jogos ou renderização gráfica.
Segundo o autor, trata-se de um servidor dedicado para grandes modelos de linguagem, utilizado com softwares como LM Studio, que permite executar modelos de IA diretamente no computador, sem depender de serviços em nuvem.
A quantidade de VRAM disponível é um dos principais diferenciais do projeto. Somando as duas Radeon AI Pro, o sistema oferece 64 GB de memória de vídeo, capacidade que permite executar modelos muito maiores do que aqueles suportados por placas de vídeo convencionais voltadas para jogos.
Nos últimos anos, a VRAM passou a ser um dos recursos mais importantes para quem trabalha com IA local. Modelos com dezenas de bilhões de parâmetros frequentemente exigem dezenas de gigabytes de memória apenas para serem carregados integralmente na GPU.
Limitar o consumo reduziu bastante o ruído
Embora cada Radeon AI Pro possa consumir até cerca de 300 watts em carga máxima, o usuário afirma que optou por limitar ambas as placas a 225 W.
Segundo ele, a redução praticamente não afetou o desempenho durante a execução do modelo Qwen3.6, mas diminuiu significativamente o ruído das ventoinhas.
O autor também afirma que, com essa configuração, as GPUs permanecem próximas de 70 °C durante carga elevada.
Essas temperaturas e níveis de ruído não puderam ser verificados de forma independente e correspondem às medições informadas pelo próprio responsável pela montagem.
Outro detalhe citado é que uma atualização recente da BIOS das Radeon AI Pro reduziu a rotação mínima das ventoinhas para cerca de 12% em repouso, tornando o sistema praticamente silencioso quando não está processando modelos de IA.
O projeto ainda deve crescer
O servidor ainda não é considerado finalizado pelo próprio criador.
Entre os próximos planos estão substituir a placa-mãe atual por uma ASUS ROG Strix X870-I Gaming WiFi, trocar o processador pelo Ryzen 9 9950X3D e instalar um sistema de refrigeração líquida compatível com o gabinete.
O objetivo mais ambicioso, porém, é expandir ainda mais a capacidade de processamento utilizando duas GPUs externas conectadas por USB4, transformando o pequeno gabinete em uma plataforma ainda mais poderosa para inteligência artificial.
Você também deve ler!
Empresa monta infraestrutura de IA local com três Mac Studio para atender cerca de 200 funcionários