Voltar para notícias
blogs.microsoft.com
1 visualizações

Microsoft apresenta Maia 200, acelerador IA para inferência e eficiência de tokens

A Microsoft anunciou o Maia 200, acelerador de IA de próxima geração construído para cargas de inferência em escala no Azure. Oferece até 4x melhor desempenho de inferência em comparação ao Maia 100 em grandes modelos de linguagem, 40% menor custo por token e 2x mais eficiência energética. Inovações incluem núcleos tensor aprimorados, subsistema de memória com HBM3e até 1TB por chip, aceleradores específicos para inferência e rede integrada de 1.6Tbps Ethernet. Projetado para sistemas Azure com resfriamento líquido, integra-se ao Azure Cobalt CPU e Azure Boost. Sistema por rack: 256 chips Maia 200 + 32 CPUs Cobalt, 2.5 ExaFLOPS FP8 agregado, 256TB HBM3e. Disponibilidade geral no segundo semestre de 2026. Por Scott Guthrie, EVP Cloud + AI, 26 de janeiro de 2026.