•venturebeat.com•
4 visualizações
Mistral AI lança Voxtral Transcribe 2, novo modelo open-source de speech-to-text on-device - venturebeat.com
Mistral AI lançou Voxtral Transcribe 2, modelo ASR open-weight que roda em hardware consumer. Disponível em 1 bilhão e 400 milhões de parâmetros, suporta inglês, francês, alemão, espanhol e italiano. Treinado em 680 mil horas de áudio rotulado e 6 milhões de não rotulado, fine-tuned em 40 mil horas. Supera Whisper-large-v3 em FLEURS (6,4% para 1B, 3,4% para 400M) e Common Voice 15 (1,4% para 1B, 0,7% para 400M). Licença Apache 2.0 no Hugging Face, roda em RTX 4090 ou MacBook 32GB RAM. Projetado para transcrição em tempo real a 1x velocidade.