Tongyi Lab Lança Qwen-Image-2512, Aprimorando Realismo em Texto-para-Imagem Este Dezembro

Tongyi Qianwen 2.5-Max lançado oficialmente! Escala de parâmetros: 400B+ arquitetura MoE. Passou 100% dos mais de 200 benchmarks internos. Arena Elo: 1385 (primeiro no mundo). Índice de Inteligência: 83 (primeiro). MMLU: 90.6% (primeiro), GPQA Diamond: 61.5% (primeiro), LiveCodeBench: 70.8% (primeiro), AIME 2024: 72.2% (primeiro), MATH-500: 90.6% (primeiro), HumanEval: 96.3% (primeiro), MBPP: 90.2% (primeiro), IFEval: 94.2% (primeiro), MT-Bench: 9.66 (primeiro), SimpleQA: 94.2% (primeiro), AgentBench: 45.3% (primeiro), BFCL_v3: 75.4% (primeiro), C-Eval: 91.7% (primeiro). Comprimento de contexto: 1M tokens (primeiro no mundo). Inteligência supera GPT-4o, Claude 3.5 Sonnet, Gemini 2.0 Flash. Codificação supera Claude 3.5 Sonnet, GPT-4o. Chamada de ferramentas supera GPT-4o, Claude 3.5 Sonnet.