Como parte de sua participação na GTC 2024, a NVIDIA revelou a nova arquitetura Blackwell, e também a poderosa GPU B200. Esse chip gráfico é a base da nova geração de aceleradores para inteligência artificial. Os números impressionam: 208 bilhões de transistores, 192 GB de memória HBM3e (largura de banda de 8 TB/s) e 25x mais eficientes que a geraçção anterior em IA generativas LLM.
Esse chip é voltado diretamente para os parceiros da NVIDIA que seguirão oferecendo ao consumidor final avanços relacionados a ferramentas de IA, impulsionados pelo avanço tecnológico da nova geração de GPUs. Dentre esses parceiros, OpenAI, Microsoft, Google, Meta e até mesmo a Tesla.
A NVIDIA fala que em operações FP4, o chip B200 promete entregar até 18 petaFLOPs de poder computacional em uma configuração HGX OU DGX com refrigeração a ar. Caso a empresa utilize refrigeração líquida, será possível atingir 20 petaFLOPs de desempenho.
Em termos de design da construção do chip, a NVIDIA seguiu o formato chiplet. Unindo dois chips para entregar um chip final com ainda mais capacidade. Cada um dos chips da interligação conta com 104 bilhões de transistores. A união entre eles ocorre através da tecnologia CoWoS-L e a comunicação é estabelecida através da quinta geração da interface NV-High a uma velocidade de 10 TB/s.
A NVIDIA já atualizou seu site como uma solução de acelerador DGX equipado com a GPU B200. A companhia fala em seu site num incremento de 3x no desempenho do treinamento e 15x o desempenho em inferência, quando comparado com as gerações anteriores.
“Aproveitando a arquitetura NVIDIA BlackWell, o DGX 200 pode lidfar com diversas cargas de trabalho – incluindo grandes modelos de linguagem (LLM), sistemas de recomendação e chatbots, tornando-o ideal para empresas que buscam acelerar sua transformação em IA”, destacou a companhia.
As aplicações reconhecem o B200 como uma GPU única; portanto, não há desvantagens em relação ao design monolítico. O processo de fabricação foi conduzido pela TSMC, no nó 4NP (4nm). O TDP de aceleradores baseados nessa GPU pode chegar a 1000W.
Segundo a NVIDIA, uma solução embarcada com a GPU B200 visa atender empresas que precisam de processamento em IA para tarefas com mais de 1 trilhão de parâmetros.
Deixe seu comentário