Voltar para notícias
mistral.ai
0 visualizações

Mistral OCR 4 suporta 170 idiomas e pode ser auto-hospedado

A Mistral lançou o OCR 4, modelo de IA para documentos empresariais com suporte a 170 idiomas, caixas delimitadoras, classificação de blocos e escores de confiança. Pode ser implantado em contêiner único e tem preço a partir de US$ 2 por mil páginas.

Mistral OCR 4 suporta 170 idiomas e pode ser auto-hospedado
A Mistral AI lançou o OCR 4, seu mais novo modelo de reconhecimento óptico de caracteres voltado para documentos empresariais. O sistema oferece suporte a 170 idiomas, distribuídos em dez grupos linguísticos, e retorna não apenas o texto extraído, mas também caixas delimitadoras, classificação por tipo de bloco (títulos, tabelas, equações, assinaturas) e escores de confiança embutidos. Em avaliações cegas com anotadores independentes, o OCR 4 obteve taxa de preferência média de 72% em comparação com concorrentes. No benchmark público OlmOCRBench, alcançou 85,20 pontos, o maior entre os modelos testados. O modelo foi projetado para ser compacto e executado em um único contêiner, permitindo implantação totalmente auto-hospedada. Isso atende a requisitos de residência de dados, soberania e conformidade, já que as organizações podem manter os documentos em sua própria infraestrutura. O OCR 4 também serve como componente de ingestão para pipelines de busca empresarial, RAG (geração aumentada por recuperação) e extração para domínios específicos. A Mistral integrou o modelo ao Search Toolkit, seu framework de busca de código aberto, anunciado durante o AI Now Summit. O preço da API do OCR 4 é de US$ 4 por mil páginas, com desconto de 50% para processamento em lote (Batch API), reduzindo o custo para US$ 2 por mil páginas. Já o Document AI, que adiciona camadas estruturadas sobre o OCR, custa US$ 5 por mil páginas. O modelo está disponível via API, Mistral Studio, Amazon SageMaker, Microsoft Foundry e, em breve, Snowflake Parse Document. A Mistral ressalta que o OCR 4 é um modelo de compreensão de documentos, não um tomador de decisões, e não deve ser usado para diagnósticos médicos, aconselhamento jurídico ou sistemas críticos de segurança.