Google apresenta Gemini Omni para criar e editar de qualquer entrada

A Google anunciou nesta quarta-feira o lançamento do Gemini Omni Flash, o primeiro modelo da família Omni, que permite criar e editar vídeos a partir de qualquer tipo de entrada — texto, imagem, áudio ou vídeo — usando comandos em linguagem natural. A novidade foi apresentada como um avanço na capacidade multimodal do Gemini, que agora combina raciocínio com geração de conteúdo. O modelo já está disponível globalmente para assinantes dos planos Google AI Plus, Pro e Ultra, por meio do aplicativo Gemini e do Google Flow. A partir desta semana, também será liberado gratuitamente para usuários do YouTube Shorts e do YouTube Create App. A Google planeja expandir o acesso para desenvolvedores e clientes empresariais via APIs nas próximas semanas. O Gemini Omni Flash se destaca por permitir edições em múltiplas etapas, mantendo a consistência dos personagens, da física e do cenário. É possível, por exemplo, transformar uma escultura em bolhas de sabão, mudar a iluminação de uma cena ou sincronizar luzes de apartamentos com uma música. O modelo também incorpora conhecimento do Gemini sobre história, ciência e cultura, indo além do simples reconhecimento de padrões para criar narrativas significativas. Todos os vídeos gerados recebem a marca d'água digital imperceptível SynthID, e a Google afirma que está comprometida com o desenvolvimento responsável da IA, com políticas claras para evitar usos prejudiciais. A edição de áudio e fala ainda está em fase de testes para garantir segurança antes de ser liberada ao público.