Google ist einer der Technologiekonzerne, die sich sehr aktiv an der Entwicklung von Tools für künstliche Intelligenz (KI) beteiligen. Dazu gehören der Chatbot Gemini als Konkurrenz zu ChatGPT oder das textbasierte Bildbearbeitungstool Imagen. Googles Fähigkeit, Videos aus beschreibenden Texten zu erstellen, wird von der Technologie-Community jedoch immer noch als deutlich unterlegen gegenüber der Konkurrenz angesehen.
Google hat kürzlich offiziell ein Tool vorgestellt, das Nutzer von Gemini Advanced dabei unterstützt, Text in hochauflösende Videos mit einer Dauer von 8 Sekunden umzuwandeln. Gleichzeitig wurde die Whisk Animate-Funktion eingeführt, mit der statische Bilder in lebendige Animationsvideos mit ähnlicher Dauer umgewandelt werden können. Beide Funktionen stehen ab sofort Nutzern von Google One AI Premium zur Verfügung.
Veo 2 markiert laut Google einen großen Fortschritt in der Videoproduktion und wurde entwickelt, um hochauflösende, detaillierte, realistische und filmische Videos zu produzieren. Veo 2 erfasst reale Physik und menschliche Bewegungen und kann so flüssige Charakterbewegungen, dynamische Szenen und exquisite Details für eine Vielzahl von Themen und Stilen erzeugen.
Um ein Video zu erstellen, müssen Nutzer Veo 2 aus dem Modellmenü von Gemini auswählen (die Position dieser Option auf der Benutzeroberfläche kann sich während der Entwicklung ändern). Die Funktion erstellt ein 8-sekündiges Video mit einer Auflösung von 720p, das als MP4 im Querformat 16:9 exportiert wird. Google weist außerdem darauf hin, dass die Anzahl der pro Monat erstellbaren Videos begrenzt ist.
Benutzer beschreiben einfach die Szene, die sie sich vorstellen – sei es eine Kurzgeschichte, eine visuelle Idee oder eine konkrete Szene. Gemini erweckt diese Ideen dann zum Leben. Je detaillierter die Beschreibung des Benutzers, desto besser das fertige Video.
Google gibt an, dass Nutzer mit Veo 2 erstellte Videos problemlos auf Social-Media-Plattformen wie TikTok oder YouTube Shorts teilen können. Allerdings haben die mit Veo 2 erstellten Videos ein Seitenverhältnis von 16:9, was für die Veröffentlichung auf diesen Videoplattformen völlig ungeeignet ist.

Die Videoerstellungsfunktion steht jetzt Gemini Advanced-Nutzern weltweit sowohl im Web als auch auf Mobilgeräten zur Verfügung. Sie ist jedoch nur für Abonnenten des Google One AI Premium-Tarifs verfügbar, wobei Gemini die vollständige Sprachunterstützung bietet.
Derzeit wird Veo 2 von Google für Gemini Advanced-Benutzer bereitgestellt. Der Servicepreis beträgt in Vietnam 489.000 VND/Monat.
Zusätzlich zu Veo 2 hat Google auch ein KI-Tool namens Whisk Animate herausgebracht, mit dem Benutzer neue Bilder mit beschreibendem Text erstellen und dieses Bild dann in ein Video mit flüssigen Bewegungen umwandeln können, das aber, ähnlich wie Veo 2, nur eine maximale Länge von 8 Sekunden hat.
Whisk, ein Google Labs-Experiment, das Ende 2024 startet, hilft Nutzern, neue Ideen mithilfe von Text- und Bildaufforderungen schnellzu erkunden und zu visualisieren. Mit der Whisk Animate-Funktion können Nutzer ihre Ideen zum Leben erwecken.
Whisk Animate ermöglicht es, Standbilder mithilfe der Veo 2-Technologie in 8-Sekunden-Livevideos umzuwandeln. Die Funktion ist für Google One AI Premium-Abonnenten in über 60 Ländern verfügbar.

Google erklärte außerdem, wichtige Schritte unternommen zu haben, um eine sichere Videoerstellung zu gewährleisten. Dazu gehören Red-Teaming und umfassende Überprüfungen, um die Erstellung von Inhalten zu verhindern, die gegen die Richtlinien von Google verstoßen. Darüber hinaus wird jedes mit Veo 2 erstellte Video mit SynthID versehen, einem digitalen Wasserzeichen, das in jedes Bild eingebettet ist und deutlich darauf hinweist, dass es KI-generiert ist.
Quelle: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp
Kommentar (0)