Arquitetura Blackwell: NVIDIA anuncia a GPU B200 – 208 bilhões de transistores e 192 GB de memória HBM3e

Arquitetura Blackwell: NVIDIA anuncia a GPU B200 – 208 bilhões de transistores e 192 GB de memória HBM3e

Como parte de sua participação na GTC 2024, a NVIDIA revelou a nova arquitetura Blackwell, e também a poderosa GPU B200. Esse chip gráfico é a base da nova geração de aceleradores para inteligência artificial. Os números impressionam: 208 bilhões de transistores, 192 GB de memória HBM3e (largura de banda de 8 TB/s) e 25x mais eficientes que a geraçção anterior em IA generativas LLM.

134375 nvidia blackwell b200 gtc 2

Esse chip é voltado diretamente para os parceiros da NVIDIA que seguirão oferecendo ao consumidor final avanços relacionados a ferramentas de IA, impulsionados pelo avanço tecnológico da nova geração de GPUs. Dentre esses parceiros, OpenAI, Microsoft, Google, Meta e até mesmo a Tesla.

A NVIDIA fala que em operações FP4, o chip B200 promete entregar até 18 petaFLOPs de poder computacional em uma configuração HGX OU DGX com refrigeração a ar. Caso a empresa utilize refrigeração líquida, será possível atingir 20 petaFLOPs de desempenho.

2 640.8b5fb8d0
GPU B200

Em termos de design da construção do chip, a NVIDIA seguiu o formato chiplet. Unindo dois chips para entregar um chip final com ainda mais capacidade. Cada um dos chips da interligação conta com 104 bilhões de transistores. A união entre eles ocorre através da tecnologia CoWoS-L e a comunicação é estabelecida através da quinta geração da interface NV-High a uma velocidade de 10 TB/s.

A NVIDIA já atualizou seu site como uma solução de acelerador DGX equipado com a GPU B200. A companhia fala em seu site num incremento de 3x no desempenho do treinamento e 15x o desempenho em inferência, quando comparado com as gerações anteriores.

Captura de tela 2024 03 19 120938

“Aproveitando a arquitetura NVIDIA BlackWell, o DGX 200 pode lidfar com diversas cargas de trabalho – incluindo grandes modelos de linguagem (LLM), sistemas de recomendação e chatbots, tornando-o ideal para empresas que buscam acelerar sua transformação em IA”, destacou a companhia.

Captura de tela 2024 03 19 121117

As aplicações reconhecem o B200 como uma GPU única; portanto, não há desvantagens em relação ao design monolítico. O processo de fabricação foi conduzido pela TSMC, no nó 4NP (4nm). O TDP de aceleradores baseados nessa GPU pode chegar a 1000W.

Segundo a NVIDIA, uma solução embarcada com a GPU B200 visa atender empresas que precisam de processamento em IA para tarefas com mais de 1 trilhão de parâmetros.

Sobre o Autor

Avatar de William R. Plaza
Editor-chefe no Hardware.com.br, aficionado por tecnologias que realmente funcionam. Segue lá no Insta: @plazawilliam Elogios, críticas e sugestões de pauta: william@hardware.com.br
Leia mais
Redes Sociais:

Deixe seu comentário

X