O Google começou a disponibilizar nesta terça-feira (15) a nova versão do seu modelo de inteligência artificial para geração de vídeos a partir de comandos em texto. Chamado de Veo 2, o recurso está acessível para usuários do plano pago Gemini Advanced e também por meio do aplicativo experimental Whisk, exclusivo para assinantes do plano IA Premium do Google One.
O Veo 2 permite criar vídeos em alta definição de até oito segundos, com um limite mensal de produções. Para utilizar a ferramenta, é necessário selecionar o modelo no menu do Gemini e inserir um comando textual descrevendo a cena desejada. O usuário pode indicar o gênero, o tipo de lente de câmera e até efeitos visuais que devem aparecer no vídeo.
Assim como o Sora, modelo da OpenAI (criadora do ChatGPT), o Veo 2 é voltado para a criação de vídeos realistas. Segundo o Google, ele "entende melhor a física do mundo real e, por isso, consegue gerar cenas realistas e detalhes mais refinados".
A empresa também afirmou que os vídeos são produzidos com base nos comandos fornecidos pelos usuários, o que pode resultar em casos considerados questionáveis.
"Tomamos medidas importantes para tornar a geração de vídeos uma experiência segura. Isso inclui um amplo processo de red teaming [voltado para identificar brechas em sistemas] e avaliações com o objetivo de impedir a geração de conteúdo que viole nossas políticas", declarou o Google.