Modelo de IA chinês de código aberto GLM-5.2 supera GPT-5.5 em benchmarks de programação

GLM-5.2, da Z.ai, tem 753 bilhões de parâmetros, janela de 1 milhão de tokens e marcou 62,1 no SWE-bench Pro — acima dos 58,6 do GPT-5.5. Pesos disponíveis via MIT.

A Z.ai, startup chinesa de inteligência artificial antes conhecida como Zhipu, lançou o GLM-5.2, um modelo de linguagem de código aberto com 753 bilhões de parâmetros voltado para escrita de código e tarefas de longa execução.

Os resultados dos benchmarks colocam o modelo acima do GPT-5.5 em duas avaliações centrais: no SWE-bench Pro, o GLM-5.2 marcou 62,1 contra 58,6 do GPT-5.5; no FrontierSWE (Dominance), atingiu 74,4% contra 72,6% do modelo da OpenAI. No Terminal-Bench, o GLM-5.2 foi o primeiro modelo de código aberto a ultrapassar 80%, superando também o Gemini. No teste Humanity’s Last Exam com uso de ferramentas externas, o modelo da Z.ai obteve 54,7, acima dos 52,2 do GPT-5.5, ficando próximo do Claude Opus 4.8 (57,9).

glm 1

A arquitetura usa uma otimização chamada IndexShare: um único indexador é reutilizado a cada quatro camadas de atenção esparsa, o que reduz os FLOPs por token em 2,9 vezes no contexto máximo de 1 milhão de tokens. O modelo também usa um esquema de previsão de múltiplos tokens (MTP) atualizado, que permite que a decodificação especulativa pule 20% mais tokens durante a inferência. A janela de contexto de 1 milhão de tokens é cinco vezes maior do que a do GLM-5.1, que tinha 200.000 tokens.

O GLM-5.2 opera em dois modos de raciocínio: o modo “máximo” gera em média 85.000 tokens por tarefa; o modo “alto” gera metade disso com melhor equilíbrio entre desempenho e consumo de recursos. Os arquivos do modelo estão disponíveis no Hugging Face sob licença MIT, o que permite download, ajuste e execução local sem custo de licença.

O acesso via API custa $1,40 por 1 milhão de tokens de entrada e $4,40 por 1 milhão de tokens de saída. Para desenvolvedores que preferem assinatura fixa, o plano Lite sai por $12,60 ao mês; o Pro, por $50,40 (cinco vezes mais recursos que o Lite); o Max, por $112,00 ao mês, com recursos vinte vezes maiores que o Lite e capacidade dedicada nos horários de pico. O modelo tem integração nativa com ferramentas como Claude Code, Cline e OpenClaw via endpoint compatível com Anthropic, trocando apenas a URL base e o nome do modelo.

Postado por
Editor-chefe no Hardware.com.br/GameVicio Aficionado por tecnologias que realmente funcionam. Segue lá no Insta: @plazawilliam Elogios, críticas e sugestões de pauta: william@hardware.com.br
Siga em:
Compartilhe
Deixe seu comentário
Assine nossa Newsletter
Assine nossa newsletter e receba nossa seleção de conteúdo sobre tecnologia, games, IA e internet em seu email.
Veja também
Publicações Relacionadas
Img de rastreio
Localize algo no site!