•blog.google•
2 visualizações
Google lança Gemini 3.1 Flash-Lite, modelo Gemini 3 mais rápido e custo-eficiente
O Google introduziu o Gemini 3.1 Flash Lite, seu modelo mais custo-eficiente até agora. Projetado para respostas de alta qualidade com fração do custo e latência de outros modelos, ideal para chatbots de suporte, moderação de conteúdo e extração de dados. Supera ou iguala o Gemini 2.5 Flash em benchmarks chave, sendo 60% mais barato e 2x mais rápido em tarefas sensíveis a latência. Multimodal, destaca-se em codificação (LiveCodeBench 24.1, SciBench), matemática (GPQA Diamond 41.7, AIME 2024 52.5), raciocínio e instruções. Latência mediana de 0.44 segundos TTFT, até 2.500 tokens/segundo. Preços: entrada $0.10/1M tokens, saída $0.40/1M. Disponível em preview público no Gemini API.