
Lors de l'événement Google I/O 2025, Google a choqué le monde de la technologie en présentant un modèle d'IA générateur de vidéos appelé Veo 3, marquant un grand pas en avant pour un géant de la technologie dans un domaine controversé.
Selon l'expérience d'Allison Johnson, journaliste à The Verge , la chose la plus sophistiquée de Veo 3 est sa capacité à créer un son original pour chaque vidéo, des effets sonores, du bruit de fond jusqu'aux dialogues des personnages.
« Veo 3 me semble être un générateur de contenu IA absolument « nul » », a commenté le journaliste de The Verge .
De nouvelles fonctionnalités et un réalisme choquant
« Nous entrons dans une nouvelle ère de créativité », a expliqué Josh Woodward, vice-président de Gemini chez Google, lors du discours de lancement de Veo 3, soulignant la possibilité de créer des vidéos « ultra-réalistes ».
Johnson était initialement sceptique, mais après avoir expérimenté l'outil d'IA, elle a été convaincue que Woodward n'exagérait pas. Veo 3 est capable de créer des produits d'un réalisme effrayant.
Plus précisément, le journaliste de The Verge a tenté de créer une courte vidéo illustrant l'annonce d'un incendie par un présentateur de journal télévisé. Le clip est extrêmement convaincant, avec une qualité sonore et des décors dignes d'un reportage traditionnel.
![]() |
Une scène d'une vidéo créée par Veo 3. Photo : The Verge. |
La publication, qui comprenait une série de vidéos mettant en scène des personnages générés par l'IA protestant contre les commandes utilisées pour créer ces vidéos, a depuis récolté 50 000 votes positifs sur Reddit. Les scènes incluent une catastrophe, une femme allongée dans un lit d'hôpital sous respirateur artificiel et un personnage menacé avec une arme – le tout accompagné de dialogues et d'un fond sonore réaliste.
Comparé à d'autres outils de création vidéo IA, Veo 3 simplifie grandement les choses. Il suffit d'une simple commande, de quelques minutes d'attente pour que la plateforme traite le processus et d'un abonnement à l'offre IA Ultra de Google ( 249,99 $ par mois).
Il était encore plus facile pour Johnson de créer des vidéos en utilisant des commandes moins spécifiques, et cela a mis en évidence une chose : le Veo 3 excelle dans la création du type de contenu YouTube le plus petit dénominateur commun pour les enfants.
La fin de « l'ère du cinéma muet »
À ce jour, aucun modèle de génération vidéo par IA n'était capable de fournir simultanément un son synchronisé, voire aucun son, pour accompagner la sortie vidéo. Cependant, Veo 3, grâce à ses capacités de génération audio synchronisée, entend mettre fin à « l'ère du silence ».
« Nous sortons de l'ère silencieuse de la création vidéo », a déclaré le PDG de Google DeepMind, Demis Hassabis, lors d'une conférence de presse.
La disponibilité généralisée des outils de création de vidéos a conduit à une explosion du nombre de fournisseurs au point que l’espace est en train de devenir saturé.
Des startups comme Runway, Lightricks, Genmo, Pika, Higgsfield, Kling et Luma aux géants de la technologie comme OpenAI et Alibaba, les modèles sont publiés à un rythme soutenu. Dans bien des cas, les différences entre ces modèles sont minimes.
Il reste à voir si Veo 3 sera capable de surpasser OpenAI Sora en termes de qualité vidéo, mais la possibilité de produire des vidéos entièrement produites avec à la fois audio et vidéo pourrait immédiatement faire de Veo 3 une plate-forme plus convaincante.
![]() |
La caractéristique la plus remarquable du Veo 3 est sa capacité à créer un son parfaitement synchronisé avec la vidéo. Photo : Google. |
« Dans le monde du cinéma et de la télévision, les bruits de fond et les effets sonores sont souvent l'œuvre d'artistes. Imaginez maintenant qu'il vous suffise de décrire à Veo le son souhaité en arrière-plan et associé à l'action, et qu'il le reproduise intégralement, y compris la vidéo et les dialogues. C'est un travail que les animateurs pourraient accomplir pendant des semaines, voire des mois », a commenté Johnson.
Si Veo 3 peut réellement suivre des commandes et produire des heures de vidéo et d'audio cohérentes, il ne faudra pas longtemps avant que nous ayons le premier long métrage d'animation créé entièrement avec l'IA.
Peu après le lancement de Veo 3, les créateurs ont commencé à partager des clips sur des plateformes comme X, notamment un clip de stand-up entièrement créé grâce à l'IA. Les spectateurs ont été stupéfaits d'apprendre que la scène entière, voix, vidéo et même l'audio du public, était créée à partir d'une simple description textuelle.
Il existe également un autre clip viral qui recrée Pythagore expliquant son célèbre théorème, avec un contexte ancien et des dialogues précis. Il existe même un clip entièrement réalisé par Veo 3, où les visuels et la musique sont parfaitement synchronisés.
L'Economic Times a commenté que ce type de technologie pourrait être appelé « une nouvelle ère du cinéma », permettant à quiconque - des créateurs individuels aux grands studios de médias - de produire du contenu professionnel à faible coût et avec des ressources minimales.
Source : https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Comment (0)