Voltar para notícias
z.ai
0 visualizações

Z.ai lança GLM-5.2, modelo open source com 1 milhão de tokens

Novo modelo de linguagem da Z.ai foca em tarefas de longo prazo, com contexto de 1M de tokens e código aberto. Supera concorrentes em benchmarks de codificação e mantém liderança entre modelos abertos.

A Z.ai apresentou o GLM-5.2, seu mais novo modelo principal desenvolvido para tarefas de horizonte longo (long-horizon tasks). O modelo chega com um contexto sólido de 1 milhão de tokens, avanços em arquitetura — como o novo mecanismo IndexShare — e licença MIT, sem restrições regionais. O foco é manter a qualidade em trajetórias longas e complexas de agentes de codificação, algo que vai além de simplesmente aceitar mais tokens. Em benchmarks de codificação de longo prazo, o GLM-5.2 alcançou resultados expressivos. No FrontierSWE, que mede a capacidade de completar projetos técnicos abertos em escala de horas, o modelo fica apenas 1% atrás do Opus 4.8, supera o GPT-5.5 em 1% e o Opus 4.7 em 11%. No PostTrainBench, onde cada agente recebe uma GPU H100 para melhorar modelos menores, o GLM-5.2 fica em segundo lugar, atrás apenas do Opus 4.8. Já no SWE-Marathon, que envolve tarefas como construção de compiladores e otimização de kernels, o novo modelo ainda tem margem para crescer, ficando 13% atrás do Opus 4.8, mas ainda assim é o melhor entre os modelos open source. O GLM-5.2 introduz o sistema IndexShare, que reduz o custo computacional ao reutilizar o mesmo indexador a cada quatro camadas de atenção esparsa. Isso resulta em uma redução de 2,9 vezes nos FLOPs por token em contextos de 1 milhão de tokens. Além disso, a camada MTP (Multi-Token Prediction) foi melhorada para decodificação especulativa, aumentando o comprimento de aceitação em até 20%. O modelo também oferece controle de nível de esforço, permitindo ao usuário equilibrar capacidade, velocidade e custo computacional conforme a tarefa. O lançamento do GLM-5.2 sinaliza um movimento importante no ecossistema de IA aberta: um modelo de alto desempenho que rivaliza com soluções fechadas como o Opus 4.8 e o GPT-5.5, mas com total transparência e sem barreiras de acesso. Para o mercado brasileiro, isso significa oportunidade de uso em pesquisa, desenvolvimento e produção sem dependência de APIs proprietárias. O modelo já está disponível para teste no site da Z.ai e nos repositórios no GitHub e HuggingFace.