
En el evento Google I/O 2025, Google sorprendió al mundo tecnológico cuando presentó un modelo de inteligencia artificial generador de videos llamado Veo 3, lo que marca un gran paso adelante para un gigante tecnológico en un campo controvertido.
Según la experiencia de la reportera de The Verge Allison Johnson, lo más sofisticado de Veo 3 es su capacidad de crear audio original para cada vídeo, desde efectos de sonido, ruido de fondo hasta incluso diálogos de los personajes.
"Veo 3 me parece una máquina generadora de contenido con inteligencia artificial absolutamente 'basura'", comentó el periodista de The Verge .
Nuevas funciones y un realismo impactante
“Estamos entrando en una nueva era de creatividad”, explicó Josh Woodward, vicepresidente de Gemini de Google, durante la conferencia de lanzamiento de Veo 3, destacando la capacidad de crear videos “ultra realistas”.
Al principio, Johnson se mostró escéptica, pero tras experimentar la herramienta de IA en persona, se convenció de que Woodward no exageraba. Veo 3 es capaz de crear productos de un realismo aterrador.
En concreto, un reportero de The Verge intentó crear un vídeo corto con el contenido de un presentador de noticias anunciando un incendio. El clip es sumamente convincente, con una calidad de sonido y una ambientación similares a las de cualquier noticia tradicional.
![]() |
Una escena de un vídeo creado por Veo 3. Foto: The Verge. |
La publicación, que incluía una serie de videos con personajes generados por IA que protestaban contra los comandos utilizados para crearlos, ha acumulado 50.000 votos positivos en Reddit. Las escenas incluyen un desastre, una mujer en una cama de hospital conectada a un respirador y un personaje amenazado con una pistola, todo con diálogos hablados y sonidos realistas de fondo.
En comparación con otras herramientas de creación de videos con IA, Veo 3 simplifica mucho las cosas. Solo se necesita un comando básico, esperar unos minutos a que la plataforma lo procese y suscribirse al plan AI Ultra de Google ( 249,99 $ al mes).
Para Johnson fue aún más fácil crear vídeos usando comandos menos específicos, y eso apuntaba a una cosa: el Veo 3 se destaca en la creación del tipo de contenido de YouTube de mínimo común denominador para niños.
El fin de la "era del cine mudo"
Hasta la fecha, ningún modelo de generación de video con IA ha sido capaz de proporcionar simultáneamente audio sincronizado, o cualquier tipo de audio, para acompañar la salida de video. Sin embargo, Veo 3, con sus capacidades de generación de audio sincronizado, busca acabar con la "era del silencio".
“Estamos saliendo de la era silenciosa de la creación de videos”, dijo el CEO de Google DeepMind, Demis Hassabis, durante una conferencia de prensa.
La amplia disponibilidad de herramientas de creación de videos ha provocado una explosión de proveedores hasta el punto en que el espacio se está saturando.
Desde startups como Runway, Lightricks, Genmo, Pika, Higgsfield, Kling y Luma, hasta gigantes tecnológicos como OpenAI y Alibaba, se están lanzando modelos a un ritmo acelerado. En muchos casos, la diferencia entre estos modelos es mínima.
Queda por ver si Veo 3 podrá superar a OpenAI Sora en términos de calidad de video, pero la capacidad de producir videos completamente producidos con audio y video podría convertir inmediatamente a Veo 3 en una plataforma más atractiva.
![]() |
La característica más destacada de Veo 3 es su capacidad para crear sonido en perfecta sincronía con el vídeo. Foto: Google. |
En el mundo del cine y la televisión, el ruido de fondo y los efectos de sonido suelen ser obra de artistas. Ahora, imagina si solo tuvieras que describirle a Veo el sonido que quieres de fondo y que esté vinculado a la acción, y Veo lo reprodujera todo, incluyendo el vídeo y los diálogos. Este es un trabajo que los animadores dedicarían semanas o meses a realizar —comentó Johnson—.
Si Veo 3 realmente puede seguir comandos y producir horas de video y audio consistentes, no pasará mucho tiempo antes de que tengamos la primera película animada creada completamente con IA.
Poco después del lanzamiento de Veo 3, los creadores comenzaron a compartir clips en plataformas como X, incluyendo un video de monólogos creado completamente con IA. Los espectadores se sorprendieron al descubrir que toda la escena, incluyendo la voz, el video e incluso el audio del público, se creó a partir de una simple descripción de texto.
También hay otro clip viral que recrea a Pitágoras explicando su famoso teorema, con contexto antiguo y diálogos precisos. Incluso hay un video musical realizado íntegramente por Veo 3, donde las imágenes y la música están en perfecta sintonía.
El Economic Times comentó que este tipo de tecnología podría denominarse "una nueva era de la producción cinematográfica" que permitirá a cualquiera, desde creadores individuales hasta grandes estudios de medios, producir contenido profesional a bajo coste y con recursos mínimos.
Fuente: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Kommentar (0)