A NVIDIA revelou o seu primeiro produto baseado na sua nova microarquitetura Ampere, que também será utilizada nas GPUs das novas placas de vídeo GeForce, a série RTX 3000. A estreia foi em alto nível, com a placa Tesla A100.
Essa que é a base do supercomputador DGX A100, conta com uma GPU GA100 baseada no processo de fabricação de 7nm (TSMC) e 40 GB de memória HBM2 (chips Samsung). Em um die de 824 mm², a compahia inseriu 54,2 bilhões de transistores (a Tesla V100, baseada em Volta, lançada em 2017, tinha 21 bilhões de transistores).
Projetado para tarefas do campo da inteligência artificial e HPC, a Tesla A100 é um módulo SMX de quarta geração (assim como Teslas anteriores, é provável que no futuro seja divulgada uma versão PCIe). Além dos 40 GB de memória de alto barramento (High Bandwidth Memory), outros números impressionam:
– 6912 núcleos CUDA;
– 108 SMs ((Streaming Multiprocessor)
– 432 núcleos tensores;
– 54.2 bilhões de transistores;
– 40 MB de cache L2;
– Interface de 512-bit;
– 432 unidades de textura;
– TPD de 400W.
“Agora a GPUsuporta TF32 para AI, o que aumenta a velocidade da computação em AI até 20 vezes para FP32 sem nenhuma alteração no código. Além disso, os núcleos tensores agora suportam o FP64, o que aumenta a velocidade do trabalho em aplicativos HPC em até 2,5 vezes em comparação com a geração anterior ”, explica a NVIDIA em nota. Há suporte para PCI Express 4.0 e NVLink.
A NVIDIA diz que a arquitetura Ampere será a mais universal e flexível de tudo o que foi criado até agora. Segundo a empresa, o sistema Tesla A100 revolucionará a operação de inteligência artificial e sistemas de processamento de dados, unificando aprendizado profundo e inferência em uma arquitetura, permitindo alcançar resultados muito superiores em contraste à arquitetura Volta, representada pelo chip Tesla V100.
Servidores de alto desempenho baseados nos aceleradores Nvidia A100 serão oferecidos por muitos grandes fabricantes, incluindo Atos, Dell, Fujitsu, Gigabyte e Supermicro. No entanto, o primeiro sistema desse tipo é o DGX A100, da própria NVIDIA. Ele inclui oito GPUs A100 conectadas através do barramento NVLink, um par de processadores AMD EPYC de 64 núcleos, um terabyte de RAM e 15 TB em SSDs. O preço do supercomputador Nvidia DGX A100 é de 200 mil dólares.