•research.google•
0 visualizações
Google lança MedGemma 1.5 para imagens médicas e MedASR para transcrição médica-research.google
Google anunciou MedGemma 1.5, suíte de modelos multimodais 4B e 27B baseados em Gemma 2, para interpretação de imagens médicas como raios-X de tórax, dermatologia e oftalmologia. Capacidades incluem geração de relatórios, VQA, legendagem e classificação. MedGemma 1.5 27B supera SOTA aberta: MIMIC-CXR (0.147 RadGraph F1), PathVQA (81.2), VQA-RAD (74.5), SLAKE (85.3). Treinado em ~10M pares imagem-texto. MedASR, modelo ASR 1B, transcreve conversas clínicas com WER 9.5% em AMI (Temple). Disponíveis via Vertex AI Health AI Developer Foundations e pesos abertos no Hugging Face.