
No evento Google I/O 2025, o Google surpreendeu o mundo da tecnologia ao apresentar um modelo de IA para geração de vídeos chamado Veo 3, marcando um grande passo para uma gigante da tecnologia em um campo controverso.
Segundo a experiência da repórter Allison Johnson, do The Verge , o recurso mais sofisticado do Veo 3 é sua capacidade de criar áudio original para cada vídeo, desde efeitos sonoros e ruídos de fundo até diálogos dos personagens.
"O Veo 3 me parece um gerador de conteúdo de IA absolutamente 'lixo'", comentou o repórter do The Verge .
Novos recursos e realismo impressionante.
“Estamos entrando em uma nova era de criatividade”, explicou Josh Woodward, vice-presidente da Gemini do Google, na apresentação de lançamento do Veo 3, destacando a capacidade de criar vídeos “ultrarrealistas”.
Inicialmente, Johnson estava cética, mas depois de experimentar a ferramenta de IA em primeira mão, convenceu-se de que Woodward não estava exagerando. O Veo 3 é capaz de criar produtos assustadoramente realistas.
Especificamente, o repórter do The Verge tentou criar um vídeo curto com o conteúdo de um apresentador de telejornal anunciando um incêndio. O vídeo é extremamente convincente, com qualidade de som e cenário semelhantes a qualquer reportagem jornalística tradicional.
![]() |
Cena de um vídeo criado pela Veo 3. Foto: The Verge. |
Logo depois, a publicação, que incluía uma série de vídeos com personagens gerados por IA protestando contra os comandos usados para criar os vídeos, recebeu 50.000 votos positivos no Reddit. As cenas incluíam um desastre, uma mulher deitada em uma cama de hospital entubada e um personagem sendo ameaçado com uma arma — tudo com diálogos e sons de fundo realistas.
Em comparação com outras ferramentas de criação de vídeo com IA, o Veo 3 simplificou bastante o processo. Basta um comando básico, alguns minutos de espera para que a plataforma processe as informações e uma assinatura do plano AI Ultra do Google (US $ 249,99 por mês).
Para Johnson, foi ainda mais fácil criar vídeos usando comandos menos específicos, o que apontava para uma coisa: o Veo 3 se destaca na criação de conteúdo para o YouTube voltado para o público infantil, do tipo que exige o mínimo denominador comum.
O fim da "era do cinema mudo"
Até o momento, nenhum modelo de geração de vídeo por IA conseguiu fornecer áudio sincronizado, ou qualquer áudio, simultaneamente à saída de vídeo. No entanto, o Veo 3 – com seus recursos de geração de áudio sincronizado – busca pôr fim à “era do silêncio”.
“Estamos saindo da era silenciosa da criação de vídeos”, disse Demis Hassabis, CEO do Google DeepMind, em uma coletiva de imprensa.
A ampla disponibilidade de ferramentas para criação de vídeos levou a uma explosão de fornecedores, a ponto de o mercado estar ficando saturado.
De startups como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling e Luma, a gigantes da tecnologia como OpenAI e Alibaba, modelos estão sendo lançados em ritmo acelerado. Em muitos casos, há pouca diferença entre esses modelos.
Ainda não está claro se o Veo 3 conseguirá superar o OpenAI Sora em termos de qualidade de vídeo, mas a capacidade de gerar vídeos totalmente produzidos com áudio e vídeo pode tornar o Veo 3 uma plataforma muito mais atraente.
![]() |
A característica mais notável do Veo 3 é sua capacidade de criar som perfeitamente sincronizado com o vídeo. Foto: Google. |
“No mundo do cinema e da televisão, o ruído de fundo e os efeitos sonoros são frequentemente obra de artistas. Agora, imagine se tudo o que você precisasse fazer fosse descrever para a Veo o som que você queria no fundo e vinculado à ação, e ela reproduziria tudo, incluindo vídeo e diálogo. Esse é um trabalho que leva semanas ou meses para os animadores fazerem”, comentou Johnson.
Se o Veo 3 realmente conseguir seguir comandos e produzir horas de vídeo e áudio consistentes, não demorará muito para termos o primeiro longa-metragem de animação criado inteiramente com IA.
Logo após o lançamento do Veo 3, criadores começaram a compartilhar vídeos em plataformas como o X, incluindo um vídeo de stand-up comedy criado inteiramente com IA. Os espectadores ficaram impressionados ao descobrir que toda a cena, incluindo narração, vídeo e até mesmo o áudio da plateia, foi criada a partir de uma simples descrição em texto.
Há também um outro vídeo viral que recria Pitágoras explicando seu famoso teorema, com contexto da época e diálogos precisos. Existe até um videoclipe feito inteiramente pela Veo 3, onde as imagens e a música estão perfeitamente sincronizadas.
O jornal The Economic Times comentou que esse tipo de tecnologia poderia ser chamado de "uma nova era da produção cinematográfica", permitindo que qualquer pessoa - desde criadores individuais até grandes estúdios de mídia - produza conteúdo profissional a baixo custo e com recursos mínimos.
Fonte: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












Comentário (0)