O Google é uma das empresas de tecnologia que tem se mostrado bastante ativa na corrida para desenvolver ferramentas de inteligência artificial (IA), incluindo o chatbot Gemini para competir com o ChatGPT ou com a ferramenta de criação de imagens baseada em texto Imagen. No entanto, a capacidade do Google de criar vídeos a partir de textos descritivos ainda é considerada pela comunidade tecnológica muito inferior à de seus concorrentes.
Mais recentemente, o Google lançou oficialmente uma ferramenta para ajudar os usuários do Gemini Advanced a converter texto em vídeos de alta resolução com duração de 8 segundos. Ao mesmo tempo, o recurso Whisk Animate também foi lançado, com a capacidade de transformar imagens estáticas em vídeos animados vívidos com duração semelhante. Ambos os recursos já estão disponíveis para usuários que assinam o Google One AI Premium.
O Veo 2 marca um salto na criação de vídeos, afirmou o Google, projetado para produzir vídeos de alta resolução, detalhados, realistas e cinematográficos. Capturando física e movimento humano do mundo real, o Veo 2 pode criar movimentos suaves de personagens, cenas dinâmicas e detalhes requintados em uma ampla gama de temas e estilos.
Para criar um vídeo, os usuários precisarão selecionar Veo 2 no menu de modelos do Gemini (a localização desta opção na interface pode mudar durante o desenvolvimento). O recurso criará um vídeo de 8 segundos com resolução de 720p, exportado como MP4 com proporção de 16:9 no formato paisagem. O Google também observa que os usuários têm um limite no número de vídeos que podem criar por mês.
Os usuários simplesmente descrevem a cena que imaginam, seja um conto, uma ideia visual ou uma cena específica. O Gemini então dá vida a essas ideias. Quanto mais detalhada a descrição do usuário, melhor será o vídeo final.
O Google afirma que os usuários podem compartilhar facilmente vídeos criados pelo Veo 2 em plataformas de mídia social como TikTok ou YouTube Shorts. No entanto, os vídeos criados pelo Veo 2 têm uma proporção de 16:9, o que é completamente inadequado para compartilhamento nessas plataformas de vídeo.

O recurso de criação de vídeos está sendo implementado globalmente para usuários do Gemini Advanced, tanto na web quanto em dispositivos móveis. No entanto, ele está disponível apenas para assinantes do plano Google One AI Premium, com suporte completo a vários idiomas no Gemini.
Atualmente, o Veo 2 é fornecido pelo Google para usuários do Gemini Advanced, com um preço de serviço de 489.000 VND/mês no Vietnã.
Além do Veo 2, o Google também lançou uma ferramenta de IA chamada Whisk Animate, que permite aos usuários criar novas imagens com texto descritivo e, em seguida, transformar essa imagem em um vídeo com movimento suave, mas também tem duração máxima de apenas 8 segundos, semelhante ao Veo 2.
O Whisk, um experimento do Google Labs com lançamento previsto para o final de 2024, ajuda os usuários a explorar e visualizar novas ideias rapidamente por meio de mensagens de texto e imagens. Os usuários podem dar vida às suas ideias com o recurso Whisk Animate.
O Whisk Animate permite transformar fotos estáticas dos usuários em vídeos ao vivo de 8 segundos usando a tecnologia Veo 2. O recurso está disponível para assinantes do Google One AI Premium em mais de 60 países.

O Google também afirmou ter tomado medidas significativas para garantir uma experiência segura na criação de vídeos. Isso inclui a criação de equipes de segurança e uma revisão abrangente para impedir a criação de conteúdo que viole as políticas do Google. Além disso, todos os vídeos criados com o Veo 2 são marcados com SynthID, uma marca d'água digital incorporada em cada quadro que indica claramente que foram gerados por IA.
Fonte: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Comentário (0)