
Lors de l'événement Google I/O 2025, Google a surpris le monde de la technologie en présentant Veo 3, un modèle d'IA de génération vidéo , marquant ainsi un grand pas en avant pour ce géant de la technologie dans un domaine controversé.
D'après l'expérience d'Allison Johnson, journaliste pour The Verge , la fonctionnalité la plus sophistiquée de Veo 3 est sa capacité à créer un son original pour chaque vidéo, allant des effets sonores aux bruits de fond, voire même aux dialogues des personnages.
« Veo 3 me semble être un générateur de contenu IA absolument "nul" », a commenté le journaliste de The Verge .
Nouvelles fonctionnalités et niveaux de réalisme saisissants
« Nous entrons dans une nouvelle ère de créativité », a expliqué Josh Woodward, vice-président de Google Gemini, lors du discours d'ouverture de Veo 3, soulignant la capacité à créer des vidéos « ultra-réalistes ».
Au départ sceptique, Johnson a finalement été convaincue, après avoir testé l'outil d'IA elle-même, que Woodward n'exagérait pas. Veo 3 est capable de créer des produits d'un réalisme saisissant.
Plus précisément, un journaliste de The Verge a tenté de créer une courte vidéo imitant un présentateur de journal télévisé annonçant un incendie. Le clip est extrêmement convaincant, avec une qualité sonore et un décor similaires à ceux d'un reportage télévisé traditionnel.
![]() |
Une scène extraite d'une vidéo créée par Veo 3. Photo : The Verge. |
Peu après, la publication, qui comprenait une série de vidéos mettant en scène des personnages générés par IA protestant contre les commandes ayant servi à la création de ces mêmes vidéos, a recueilli 50 000 votes positifs sur Reddit. Les scènes incluaient une catastrophe, une femme alitée sous respirateur artificiel et un personnage menacé par une arme à feu ; le tout accompagné de dialogues et d’ambiances sonores réalistes.
Comparé aux autres outils de création vidéo par IA, Veo 3 simplifie considérablement les choses. Il suffit d'une commande simple, de quelques minutes d'attente pour le traitement par la plateforme et d'un abonnement au forfait AI Ultra de Google ( 249,99 $ par mois).
Il était encore plus facile pour Johnson de créer des vidéos en utilisant des commandes moins spécifiques, ce qui indiquait une chose : la Veo 3 excelle dans la création de contenu YouTube très basique destiné aux enfants.
La fin de l'« ère du cinéma muet »
À ce jour, aucun modèle de génération vidéo par IA n'a été capable de fournir simultanément un son synchronisé, ni même un son tout court, pour accompagner la vidéo. Cependant, Veo 3, grâce à ses capacités de génération audio synchronisée, ambitionne de mettre fin à cette ère du muet.
« Nous sortons de l'ère du silence en matière de création vidéo », a déclaré Demis Hassabis, PDG de Google DeepMind, lors d'une conférence de presse.
La large disponibilité des outils de création vidéo a entraîné une explosion du nombre de fournisseurs, au point que le marché est en train de saturer.
Des start-ups comme Runway, Lightricks, Genmo, Pika, Higgsfield, Kling et Luma, aux géants de la tech comme OpenAI et Alibaba, les modèles se multiplient à un rythme effréné. Dans bien des cas, la différence entre ces modèles est minime.
On ne sait pas encore si Veo 3 sera capable de surpasser OpenAI Sora en termes de qualité vidéo, mais la possibilité de produire des vidéos complètes avec audio et vidéo pourrait immédiatement faire de Veo 3 une plateforme plus attrayante.
![]() |
La caractéristique la plus remarquable de Veo 3 est sa capacité à créer un son parfaitement synchronisé avec l'image. Photo : Google. |
« Dans le monde du cinéma et de la télévision, les bruitages et les effets sonores sont souvent l'œuvre d'artistes. Imaginez maintenant qu'il vous suffise de décrire à Veo le son que vous souhaitez en fond sonore, en l'associant à l'action, et que le logiciel le reproduise intégralement, y compris la vidéo et les dialogues. C'est un travail qui prend des semaines, voire des mois, aux animateurs », a commenté Johnson.
Si Veo 3 parvient à suivre des commandes et à produire des heures de vidéo et d'audio de manière continue, nous n'aurons pas à attendre longtemps avant de voir le premier long métrage d'animation entièrement créé par l'IA.
Peu après le lancement de Veo 3, des créateurs ont commencé à partager des extraits sur des plateformes comme X, notamment une vidéo de stand-up entièrement réalisée par intelligence artificielle. Les spectateurs ont été stupéfaits d'apprendre que la scène entière, voix off, vidéo et même les réactions du public, avait été créée à partir d'une simple description textuelle.
On trouve ensuite une autre vidéo virale qui recrée Pythagore expliquant son célèbre théorème, avec un contexte antique et des dialogues fidèles. Il existe même un clip musical entièrement réalisé avec Veo 3, où les images et la musique sont parfaitement synchronisées.
Le journal Economic Times a commenté que ce type de technologie pourrait être qualifié de « nouvelle ère du cinéma », permettant à tous – des créateurs individuels aux grands studios de médias – de produire du contenu professionnel à faible coût et avec un minimum de ressources.
Source : https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












Comment (0)