•microsoft.ai•
6 visualizações
Microsoft lança MAI-Transcribe-1, modelo multilíngue de fala para texto, no Foundry
A Microsoft AI anunciou o MAI-Transcribe-1, modelo de reconhecimento de fala com taxa de erro de palavra (WER) abaixo de 3% em benchmarks como LibriSpeech e Common Voice, superando o Whisper Large-v3 da OpenAI em 15-20%. Suporta mais de 100 idiomas, mantém 95% de precisão em ruído, realiza diarização de falantes. Baseado no MAI-1 com trilhões de tokens, arquitetura eficiente para dispositivos com 1GB RAM. Disponível no Azure Speech Services, Hugging Face e GitHub. Adotantes iniciais como Zoom e Salesforce relatam ganho de 40% em produtividade. Publicado em 15 de outubro de 2024.