
Auf der Google I/O 2025 sorgte Google für Aufsehen in der Tech-Welt, als das Unternehmen ein KI-Modell zur Videogenerierung namens Veo 3 vorstellte. Dies markierte einen großen Schritt des Technologiekonzerns in ein kontroverses Feld.
Laut den Erfahrungen der The Verge -Reporterin Allison Johnson ist die ausgefeilteste Eigenschaft von Veo 3 die Fähigkeit, für jedes Video einen eigenen Ton zu erstellen – von Soundeffekten über Hintergrundgeräusche bis hin zu Dialogen der Figuren.
„Veo 3 erscheint mir als ein absolut miserabler KI-Inhaltsgenerator“, kommentierte ein Reporter von The Verge .
Neue Funktionen und schockierender Realismus
„Wir treten in eine neue Ära der Kreativität ein“, erklärte Josh Woodward, Vizepräsident von Googles Gemini, in seiner Keynote zur Einführung von Veo 3 und hob die Möglichkeit hervor, „ultrarealistische“ Videos zu erstellen.
Johnson war anfangs skeptisch, doch nachdem sie das KI-Tool selbst ausprobiert hatte, war sie überzeugt, dass Woodward nicht übertrieben hatte. Veo 3 ist in der Lage, Produkte zu erstellen, die erschreckend realistisch wirken.
Konkret versuchte ein Reporter von The Verge , ein kurzes Video zu erstellen, das den Eindruck erweckt, ein Nachrichtensprecher verkünde einen Brand. Der Clip wirkt äußerst überzeugend; Tonqualität und Szenerie entsprechen denen einer herkömmlichen Nachrichtensendung.
![]() |
Eine Szene aus einem Video von Veo 3. Foto: The Verge. |
Kurz darauf erhielt der Beitrag, der eine Reihe von Videos mit KI-generierten Charakteren enthielt, die gegen die Befehle protestierten, mit denen die Videos erstellt wurden, 50.000 positive Bewertungen auf Reddit. Die Szenen zeigten eine Katastrophe, eine Frau, die im Krankenhaus an ein Beatmungsgerät angeschlossen war, und eine Person, die mit einer Waffe bedroht wurde – alles mit gesprochenen Dialogen und realistischen Hintergrundgeräuschen.
Im Vergleich zu anderen KI-gestützten Videobearbeitungstools hat Veo 3 die Sache deutlich vereinfacht. Man benötigt lediglich einen einfachen Befehl, ein paar Minuten Wartezeit für die Verarbeitung durch die Plattform und ein Abonnement für Googles AI Ultra-Tarif ( 249,99 US-Dollar pro Monat).
Für Johnson war es sogar noch einfacher, Videos mit weniger spezifischen Befehlen zu erstellen, und das deutete auf eines hin: Der Veo 3 eignet sich hervorragend zur Erstellung von YouTube-Inhalten für Kinder, die dem kleinsten gemeinsamen Nenner entsprechen.
Das Ende der „Stummfilmära“
Bislang konnte kein KI-Videogenerierungsmodell gleichzeitig synchronisierten Ton oder überhaupt Ton zur Videoausgabe bereitstellen. Veo 3 will mit seinen Funktionen zur synchronisierten Tongenerierung diese „Ära des Stummen“ jedoch beenden.
„Wir verlassen das stille Zeitalter der Videoproduktion“, sagte Demis Hassabis, CEO von Google DeepMind, auf einer Pressekonferenz.
Die weite Verbreitung von Videobearbeitungsprogrammen hat zu einer Explosion der Anbieter geführt, sodass der Markt mittlerweile gesättigt ist.
Von Startups wie Runway, Lightricks, Genmo, Pika, Higgsfield, Kling und Luma bis hin zu Tech-Giganten wie OpenAI und Alibaba werden Modelle in rasantem Tempo veröffentlicht. Oftmals unterscheiden sich diese Modelle kaum.
Ob Veo 3 OpenAI Sora in puncto Videoqualität übertreffen kann, ist noch nicht klar, aber die Möglichkeit, vollständig produzierte Videos mit Audio und Video auszugeben, könnte Veo 3 sofort zu einer attraktiveren Plattform machen.
![]() |
Das herausragendste Merkmal von Veo 3 ist seine Fähigkeit, Ton und Video perfekt zu synchronisieren. Foto: Google. |
„In der Film- und Fernsehbranche sind Hintergrundgeräusche und Soundeffekte oft das Werk von Künstlern. Stellen Sie sich nun vor, Sie müssten Veo lediglich den gewünschten Hintergrundsound beschreiben, der zur Handlung passt, und Veo würde ihn inklusive Video und Dialogen komplett ausgeben. Animatoren benötigen dafür Wochen oder Monate“, erklärte Johnson.
Wenn Veo 3 tatsächlich Befehle befolgen und stundenlanges, konsistentes Video- und Audiomaterial ausgeben kann, wird es nicht mehr lange dauern, bis wir den ersten vollständig mit KI erstellten Animationsfilm haben.
Kurz nach dem Start von Veo 3 begannen Kreative, Clips auf Plattformen wie X zu teilen, darunter ein Stand-up-Comedy-Video, das vollständig mit KI erstellt worden war. Die Zuschauer staunten nicht schlecht, als sie erfuhren, dass die gesamte Szene, inklusive Voiceover, Video und sogar Publikumsgeräuschen, lediglich aus einer Textbeschreibung generiert worden war.
Dann gibt es noch einen weiteren viralen Clip, der Pythagoras' berühmten Satz erklärt – inklusive antikem Kontext und akkuraten Dialogen. Es existiert sogar ein Musikvideo, das komplett von Veo 3 produziert wurde und in dem Bild und Musik perfekt aufeinander abgestimmt sind.
Die Economic Times kommentierte, dass diese Technologie als „eine neue Ära des Filmemachens“ bezeichnet werden könne, da sie es jedem – von einzelnen Kreativen bis hin zu großen Medienstudios – ermögliche, professionelle Inhalte kostengünstig und mit minimalem Ressourceneinsatz zu produzieren.
Quelle: https://znews.vn/ac-mong-tu-ai-tao-video-moi-cua-google-post1556018.html












Kommentar (0)