
No evento Google I/O 2025, o Google chocou o mundo da tecnologia ao apresentar um modelo de IA gerador de vídeos chamado Veo 3, marcando um grande passo para uma gigante da tecnologia em um campo controverso.
De acordo com a experiência da repórter Allison Johnson do The Verge , o mais sofisticado do Veo 3 é sua capacidade de criar áudio original para cada vídeo, desde efeitos sonoros, ruído de fundo até diálogos de personagens.
"O Veo 3 me parece uma máquina de geração de conteúdo de IA absolutamente 'lixo'", comentou o repórter do The Verge .
Novos recursos e realismo chocante
“Estamos entrando em uma nova era de criatividade”, explicou o vice-presidente da Gemini do Google, Josh Woodward, durante o discurso de lançamento do Veo 3, destacando a capacidade de criar vídeos “ultra-realistas”.
Johnson estava inicialmente cética, mas depois de experimentar a ferramenta de IA pessoalmente, ela se convenceu de que Woodward não estava exagerando. O Veo 3 é capaz de criar produtos assustadoramente realistas.
Especificamente, o repórter do The Verge tentou criar um vídeo curto com o conteúdo de um âncora de jornal anunciando um incêndio. O clipe é extremamente convincente, com qualidade de som e cenário semelhantes a qualquer reportagem jornalística tradicional.
![]() |
Uma cena de um vídeo criado pela Veo 3. Foto: The Verge. |
A publicação, que incluía uma série de vídeos com personagens gerados por IA protestando contra os comandos usados para criar os vídeos gerados por IA, já acumulou 50.000 votos positivos no Reddit. As cenas incluem um desastre, uma mulher deitada em uma cama de hospital em um ventilador e um personagem sendo ameaçado com uma arma — tudo com diálogos falados e sons de fundo realistas.
Comparado a outras ferramentas de criação de vídeos com IA, o Veo 3 simplificou bastante as coisas. Basta um comando básico, alguns minutos de espera para a plataforma processar e uma assinatura do plano AI Ultra do Google ( US$ 249,99 por mês).
Foi ainda mais fácil para Johnson criar vídeos usando comandos menos específicos, e isso apontou para uma coisa: o Veo 3 se destaca na criação do tipo de conteúdo do YouTube com o menor denominador comum para crianças.
O fim da "era do cinema mudo"
Até o momento, nenhum modelo de geração de vídeo por IA conseguiu fornecer simultaneamente áudio sincronizado, ou qualquer áudio, para acompanhar a saída de vídeo. No entanto, o Veo 3 – com seus recursos de geração de áudio sincronizado – busca acabar com a "era silenciosa".
“Estamos saindo da era silenciosa da criação de vídeos”, disse o CEO do Google DeepMind, Demis Hassabis, durante uma coletiva de imprensa.
A ampla disponibilidade de ferramentas de criação de vídeos levou a uma explosão de fornecedores a ponto de o espaço estar ficando saturado.
De startups como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling e Luma, a gigantes da tecnologia como OpenAI e Alibaba, os modelos estão sendo lançados em ritmo acelerado. Em muitos casos, há pouca diferença entre eles.
Resta saber se o Veo 3 conseguirá superar o OpenAI Sora em termos de qualidade de vídeo, mas a capacidade de gerar vídeos totalmente produzidos com áudio e vídeo pode imediatamente tornar o Veo 3 uma plataforma mais atraente.
![]() |
O recurso mais notável do Veo 3 é a capacidade de criar som em sincronia "perfeita" com o vídeo. Foto: Google. |
“No mundo do cinema e da televisão, ruídos de fundo e efeitos sonoros são frequentemente obra de artistas. Agora, imagine se tudo o que você precisasse fazer fosse descrever para o Veo o som que você queria para o fundo e anexado à ação, e ele gerasse tudo, incluindo vídeo e diálogos. Esse é um trabalho que os animadores levariam semanas ou meses fazendo”, comentou Johnson.
Se o Veo 3 realmente puder seguir comandos e gerar horas de vídeo e áudio consistentes, não demorará muito para que tenhamos o primeiro filme de animação criado inteiramente com IA.
Logo após o lançamento do Veo 3, os criadores começaram a compartilhar clipes em plataformas como a X, incluindo um vídeo de stand-up comedy criado inteiramente com IA. Os espectadores ficaram surpresos ao saber que toda a cena, incluindo voz, vídeo e até mesmo o áudio da plateia, foi criada a partir de uma simples descrição em texto.
Há também outro clipe viral que recria Pitágoras explicando seu famoso teorema, com contexto antigo e diálogos precisos. Há até um videoclipe feito inteiramente pela Veo 3, onde o visual e a música estão em perfeita sincronia.
O Economic Times comentou que esse tipo de tecnologia poderia ser chamado de "uma nova era na produção cinematográfica", permitindo que qualquer pessoa — desde criadores individuais até grandes estúdios de mídia — produzisse conteúdo profissional a baixo custo e com recursos mínimos.
Fonte: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Comentário (0)