
Lors de l'événement Google I/O 2025, Google a choqué le monde de la technologie en présentant un modèle d'IA générateur de vidéos appelé Veo 3, marquant un grand pas en avant pour un géant de la technologie dans un domaine controversé.
Selon l'expérience d'Allison Johnson, journaliste à The Verge , la chose la plus sophistiquée de Veo 3 est sa capacité à créer un son original pour chaque vidéo, des effets sonores, du bruit de fond jusqu'aux dialogues des personnages.
« Veo 3 me semble être une machine génératrice de contenu IA absolument « poubelle » », a commenté le journaliste de The Verge .
De nouvelles fonctionnalités et un réalisme choquant
« Nous entrons dans une nouvelle ère de créativité », a expliqué Josh Woodward, vice-président de Gemini chez Google, lors du discours de lancement de Veo 3, soulignant la possibilité de créer des vidéos « ultra-réalistes ».
Johnson était initialement sceptique, mais après avoir expérimenté l'outil d'IA par elle-même, elle était convaincue que Woodward n'exagérait pas. Veo 3 est capable de créer des produits terriblement réalistes.
Plus précisément, le journaliste de The Verge a essayé de créer une courte vidéo avec le contenu d'un présentateur de journal télévisé annonçant un incendie. Le clip est incroyablement convaincant, avec une qualité sonore et des décors similaires à ceux de n'importe quel journal télévisé traditionnel.
![]() |
Une scène d'une vidéo créée par Veo 3. Photo : The Verge. |
Peu de temps après, la publication, qui comprenait une série de vidéos mettant en scène des personnages générés par l'IA protestant contre les commandes utilisées pour créer les vidéos générées par l'IA, a obtenu 50 000 votes positifs sur Reddit. Les scènes incluent des catastrophes, une femme allongée dans un lit d'hôpital utilisant un tube respiratoire et un personnage menacé avec une arme à feu - le tout avec des dialogues parlés et des sons de fond réalistes.
Comparé à d’autres outils d’IA de création vidéo, Veo 3 a rendu les choses beaucoup plus simples. Il suffit d'une commande de base, de quelques minutes d'attente pour que la plateforme traite le processus et d'un abonnement au forfait AI Ultra de Google ( 249,99 $ par mois).
Il était encore plus facile pour Johnson de créer des vidéos en utilisant des commandes moins spécifiques, et cela a mis en évidence une chose : le Veo 3 excelle dans la création du type de contenu YouTube le plus petit dénominateur commun pour les enfants.
La fin de « l'ère du cinéma muet »
À ce jour, aucun modèle de génération vidéo IA n’a été capable de fournir simultanément un son synchronisé, ou tout autre type d’audio pour accompagner la sortie vidéo. Cependant, Veo 3, avec sa capacité à créer un son synchronisé, cherche à mettre fin à « l'ère du cinéma muet ».
« Nous sortons de l'ère silencieuse de la création vidéo », a déclaré le PDG de Google DeepMind, Demis Hassabis, lors d'une conférence de presse.
La disponibilité généralisée des outils de création de vidéos a conduit à une explosion du nombre de fournisseurs au point que l’espace est en train de devenir saturé.
Des startups comme Runway, Lightricks, Genmo, Pika, Higgsfield, Kling et Luma, aux géants de la technologie comme OpenAI et Alibaba, les modèles sont publiés à un rythme rapide. Dans de nombreux cas, il y a très peu de différence entre ces modèles.
Il reste à voir si Veo 3 sera capable de surpasser OpenAI Sora en termes de qualité vidéo. Cependant, la simple possibilité d'exporter des vidéos entièrement produites avec à la fois l'audio et la vidéo pourrait instantanément faire du Veo 3 une plate-forme plus attrayante.
![]() |
La caractéristique la plus remarquable du Veo 3 est sa capacité à créer un son « parfaitement » synchronisé avec la vidéo. Photo : Google. |
« Dans le monde du cinéma et de la télévision, les bruits de fond et les effets sonores sont souvent l'œuvre d'artistes. Imaginez maintenant qu'il vous suffise de décrire à Veo le son souhaité en arrière-plan et associé à l'action, et qu'il le reproduise intégralement, y compris la vidéo et les dialogues. C'est un travail que les animateurs pourraient accomplir pendant des semaines, voire des mois », a commenté Johnson.
Si Veo 3 peut réellement suivre des commandes et produire des heures de vidéo et d'audio cohérentes, il ne faudra pas longtemps avant que nous ayons le premier long métrage d'animation créé entièrement avec l'IA.
Peu de temps après le lancement de Veo 3, les créateurs ont commencé à partager des clips sur des plateformes comme X, qui présentaient une vidéo de stand-up comedy entièrement créée avec l'IA. Les spectateurs ont été surpris d’apprendre que la scène entière, y compris la voix, la vidéo et même l’audio du public, avait été créée à partir d’une seule commande de description textuelle.
Puis un autre clip est devenu viral, présentant une reconstitution de Pythagore expliquant son célèbre théorème, avec un contexte ancien et un dialogue précis. Il existe même un clip vidéo entièrement réalisé par Veo 3, où les visuels et la musique sont parfaitement synchronisés.
L'Economic Times a commenté que ce type de technologie pourrait être appelé « une nouvelle ère du cinéma », permettant à quiconque - des créateurs individuels aux grands studios de médias - de produire du contenu professionnel à faible coût et avec des ressources minimales.
Source : https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html
Comment (0)