Voltar para notícias
liquid.ai
0 visualizações

Liquid AI lança modelos de busca multilíngue com 350M parâmetros

Os modelos LFM2.5-ColBERT-350M e LFM2.5-Embedding-350M permitem busca rápida e precisa em 11 idiomas, com tamanho compacto para rodar em CPUs e dispositivos de borda.

Liquid AI lança modelos de busca multilíngue com 350M parâmetros
A Liquid AI anunciou o lançamento de dois novos modelos de recuperação de informação multilíngues: LFM2.5-ColBERT-350M e LFM2.5-Embedding-350M. Ambos possuem 350 milhões de parâmetros e são os primeiros modelos bidirecionais da família LFM, baseados no LFM2.5-350M-Base, lançado em março. Eles foram projetados para busca rápida e confiável em 11 idiomas, com um tamanho reduzido que permite execução em praticamente qualquer hardware. Os modelos são especialmente indicados para buscas em contextos curtos, como catálogos de produtos, bases de conhecimento de FAQ, documentos de suporte e outras coleções que precisam ser pesquisadas rapidamente e com baixo custo. A arquitetura bidirecional permite que cada token da consulta ou documento acesse informações de ambos os lados, diferentemente de modelos causais tradicionais, que só enxergam o contexto anterior. Isso melhora significativamente a qualidade da representação semântica para tarefas de recuperação. O treinamento seguiu três estágios: pré-treinamento contrastivo em larga escala em inglês, destilação multilíngue e multilíngue cruzada a partir de um modelo professor forte, e ajuste fino com exemplos negativos difíceis. Os modelos cobrem árabe, alemão, inglês, espanhol, francês, italiano, japonês, coreano, norueguês, português e sueco. Nos benchmarks, ambos apresentaram desempenho competitivo em todos os idiomas, com destaque para a robustez além do inglês. A Liquid AI também disponibilizou versões GGUF dos modelos para uso com llama.cpp, permitindo execução em CPUs, laptops e dispositivos de borda com latência baixa e custo quase zero. Para implantações empresariais em larga escala, a empresa desenvolveu uma pilha interna de GPU que oferece latência extremamente baixa sob alta carga. Os modelos estão disponíveis no Hugging Face, e a empresa recomenda fine-tuning para domínios específicos, especialmente para o LFM2.5-Embedding-350M.