Voltar para notícias
x.com
2 visualizações

Google Search adiciona grupos de links pop-up no hover em AI Overviews no desktop

A xAI lançou o Grok-1.5 Vision, seu primeiro modelo multimodal. O Grok-1.5V processa documentos, diagramas, gráficos, capturas de tela e fotografias. Demonstra forte capacidade em compreensão espacial do mundo real, superando modelos atuais. RealWorldQA: Grok-1.5V 68.7%, GPT-4V 56.8%, Gemini Pro 1.5 60.4%. MathVista: 63.8% vs 52.2%. DocVQA: 90.2% vs 91.1%. TextVQA: 75.8% vs 80.3%. AI2D: 90.3% vs 86.5%. ChartQA: 85.5% vs 81.0%. MMMU (val): 44.0% vs 56.0%. Grok-1.5V disponível para todos usuários X Premium na plataforma X esta semana.