A América Latina agora possui seu próprio modelo de linguagem artificial: o Latam-GPT, uma inteligência artificial de código aberto desenvolvida especificamente para entender as nuances culturais e linguísticas da região. Anunciado nesta terça-feira (10), o Latam-GPT resulta do trabalho colaborativo entre o Centro Nacional de Inteligência Artificial do Chile (CENIA) e uma ampla rede de mais de 60 organizações distribuídas em 15 países latino-americanos, incluindo o Brasil.
Diferente dos modelos de IA dominantes no mercado, que são treinados predominantemente com conteúdo em inglês, o Latam-GPT foi alimentado com um corpus linguístico massivo de 300 bilhões de tokens em português e espanhol – o equivalente a aproximadamente 230 bilhões de palavras. Esta abordagem resolve um problema crítico: atualmente, o português representa apenas 2% dos textos disponíveis nos repositórios globais de treinamento, enquanto o espanhol alcança somente 4%.
A qualidade do material de treinamento recebeu atenção especial. Todo o acervo textual passou por rigoroso processo de curadoria, com eliminação de conteúdos prejudiciais como desinformação e discursos discriminatórios, além da anonimização de informações pessoais. Os dados abrangem áreas estratégicas como humanidades, saúde, políticas públicas e conhecimentos de culturas indígenas da região.
Do ponto de vista técnico, o projeto utilizou a arquitetura Llama 3.1, com impressionantes 70 bilhões de parâmetros. A infraestrutura de nuvem fornecida pela Amazon Web Services (AWS) permitiu uma otimização significativa do processo: o tempo de treinamento foi reduzido em 64%, caindo de 25 para apenas 9 dias de processamento.
O desenvolvimento do Latam-GPT mobilizou mais de cem especialistas entre pesquisadores, cientistas e engenheiros. O Banco de Desenvolvimento da América Latina e Caribe (CAF) e o Data Observatory também participaram ativamente da iniciativa, que teve como principal objetivo criar um bem público digital para democratizar o acesso à tecnologia de ponta na região.

Por contar com licença aberta, o modelo permite que universidades, órgãos governamentais e startups o utilizem livremente para desenvolver aplicações customizadas em diversas áreas, desde educação até serviços públicos. Essa característica é particularmente importante para fomentar um ecossistema tecnológico autônomo que reconheça as particularidades culturais, históricas e políticas do continente – aspectos frequentemente negligenciados pelos sistemas existentes.
Na visão de Álvaro Soto, diretor do CENIA, o Latam-GPT não deve ser visto como um produto acabado, mas como uma base fundamental sobre a qual diferentes atores poderão construir soluções adaptadas às realidades locais, impulsionando a inovação tecnológica com identidade latino-americana.
Você também pode gostar dos artigos abaixo:
A Índia redefine as regras para deepfakes: o que as redes sociais devem fazer rapidamente