
En el evento Google I/O 2025, Google sorprendió al mundo tecnológico cuando presentó un modelo de IA generador de videos llamado Veo 3, lo que marca un gran paso adelante para un gigante tecnológico en un campo controvertido.
Según la experiencia de la periodista de The Verge , Allison Johnson, lo más sofisticado de Veo 3 es su capacidad de crear audio original para cada vídeo, desde efectos de sonido, ruido de fondo e incluso diálogos de los personajes.
"Veo 3 me parece un generador de contenido de IA absolutamente 'basura'", comentó el periodista de The Verge .
Nuevas funciones y un realismo impactante
“Estamos entrando en una nueva era de creatividad”, explicó Josh Woodward, vicepresidente de Gemini de Google, en la conferencia de lanzamiento de Veo 3, destacando la capacidad de crear videos “ultra realistas”.
Al principio, Johnson se mostró escéptica, pero tras experimentar la herramienta de IA en persona, se convenció de que Woodward no exageraba. Veo 3 es capaz de crear productos de un realismo aterrador.
En concreto, un reportero de The Verge intentó crear un vídeo corto con el contenido de un presentador de noticias anunciando un incendio. El clip es sumamente convincente, con una calidad de sonido y una ambientación similares a las de cualquier noticia tradicional.
![]() |
Una escena de un vídeo creado por Veo 3. Foto: The Verge. |
Poco después, la publicación, que incluía una serie de videos con personajes generados por IA que protestaban contra los comandos utilizados para crearlos, obtuvo 50,000 votos positivos en Reddit. Las escenas incluían un desastre, una mujer en una cama de hospital conectada a un respirador y un personaje amenazado con una pistola, todo con diálogos hablados y sonidos realistas de fondo.
En comparación con otras herramientas de creación de videos con IA, Veo 3 simplifica mucho las cosas. Solo se necesita un comando básico, esperar unos minutos a que la plataforma lo procese y suscribirse al plan AI Ultra de Google ( 249,99 $ al mes).
Para Johnson fue aún más fácil crear vídeos usando comandos menos específicos, y eso apuntaba a una cosa: el Veo 3 se destaca en la creación del tipo de contenido de YouTube de mínimo común denominador para niños.
El fin de la "era del cine mudo"
Hasta la fecha, ningún modelo de generación de video con IA ha sido capaz de proporcionar simultáneamente audio sincronizado, o cualquier tipo de audio, para acompañar la salida de video. Sin embargo, Veo 3, con sus capacidades de generación de audio sincronizado, busca acabar con la "era del silencio".
“Estamos saliendo de la era silenciosa de la creación de videos”, dijo el CEO de Google DeepMind, Demis Hassabis, en una conferencia de prensa.
La amplia disponibilidad de herramientas de creación de videos ha provocado una explosión de proveedores hasta el punto en que el espacio se está saturando.
Desde startups como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling y Luma, hasta gigantes tecnológicos como OpenAI y Alibaba, se están lanzando modelos a un ritmo acelerado. En muchos casos, hay poca diferencia entre ellos.
Todavía no está claro si Veo 3 podrá superar a OpenAI Sora en términos de calidad de video, pero la capacidad de producir videos completamente producidos con audio y video podría convertir inmediatamente a Veo 3 en una plataforma más atractiva.
![]() |
La característica más destacada de Veo 3 es su capacidad para crear sonido perfectamente sincronizado con el vídeo. Foto: Google. |
En el mundo del cine y la televisión, el ruido de fondo y los efectos de sonido suelen ser obra de artistas. Ahora, imagina si solo tuvieras que describirle a Veo el sonido que quieres de fondo y que esté vinculado a la acción, y lo reprodujera todo, incluyendo el vídeo y los diálogos. Este es un trabajo que a los animadores les lleva semanas o meses realizar», comentó Johnson.
Si Veo 3 realmente puede seguir comandos y producir horas de video y audio consistentes, no pasará mucho tiempo antes de que tengamos la primera película animada creada completamente con IA.
Poco después del lanzamiento de Veo 3, los creadores comenzaron a compartir clips en plataformas como X, incluyendo un video de monólogos creado íntegramente con IA. Los espectadores se sorprendieron al descubrir que toda la escena, incluyendo las voces en off, el video e incluso el audio del público, se creó a partir de una simple descripción de texto.
También hay otro clip viral que recrea a Pitágoras explicando su famoso teorema, con contexto antiguo y diálogos precisos. Incluso hay un video musical creado íntegramente por Veo 3, donde las imágenes y la música están en perfecta sincronía.
El Economic Times comentó que este tipo de tecnología podría denominarse "una nueva era de la cinematografía", permitiendo a cualquiera -desde creadores individuales hasta grandes estudios de medios- producir contenido profesional a bajo coste y con recursos mínimos.
Fuente: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












Kommentar (0)