Vietnam.vn - Nền tảng quảng bá Việt Nam

Google stellt Text-to-Video-KI-Tool von Gemini Advanced vor

Google stellt das Tool Gemini Advanced vor, mit dem Benutzer Textabsätze in hochauflösende Videos mit einer Dauer von 8 Sekunden umwandeln können.

VietnamPlusVietnamPlus18/04/2025

Google ist einer der Technologiekonzerne, die sich sehr aktiv am Wettlauf um die Entwicklung von Tools für künstliche Intelligenz (KI) beteiligen. Dazu gehören der Chatbot Gemini als Konkurrenz zu ChatGPT oder das Text-zu-Bild-Tool Imagen. Allerdings wird Googles Fähigkeit, Videos aus beschreibendem Text zu erstellen, von Technologieexperten immer noch als weit unterlegen gegenüber der Konkurrenz angesehen.

Vor Kurzem hat Google offiziell ein Tool vorgestellt, das Benutzer von Gemini Advanced dabei unterstützt, Text in hochauflösende Videos mit einer Dauer von 8 Sekunden umzuwandeln. Gleichzeitig wird auch die Whisk Animate-Funktion eingesetzt, mit der Standbilder in lebendige animierte Videos mit ähnlicher Dauer umgewandelt werden können. Beide Funktionen stehen jetzt Benutzern zur Verfügung, die Google One AI Premium abonnieren.

Laut Google markiert Veo 2 einen großen Fortschritt bei der Videoerstellung und wurde entwickelt, um hochauflösende, detaillierte, realistische und filmische Videos zu produzieren. Dank seiner Fähigkeit, realistische Physik und menschliche Bewegungen einzufangen, kann Veo 2 flüssige Charakterbewegungen, lebendige Szenen und exquisite Details in einer Vielzahl von Themen und Stilen erstellen.

Um ein Video zu erstellen, müssen Benutzer Veo 2 aus dem Modellmenü in Gemini auswählen (die Position dieser Option auf der Benutzeroberfläche kann sich während der Entwicklung ändern). Mit dieser Funktion wird ein 8-sekündiger Videoclip mit einer Auflösung von 720p erstellt, der im MP4-Format mit einem Querformat von 16:9 exportiert wird. Google weist außerdem darauf hin, dass die Anzahl der Videos, die Benutzer pro Monat erstellen können, begrenzt ist.

Benutzer beschreiben einfach die Szene, die sie sich vorstellen. Dabei kann es sich um eine Kurzgeschichte, eine visuelle Idee oder eine bestimmte Szene handeln. Gemini wird diese Ideen dann in die Tat umsetzen. Je detaillierter die Benutzerbeschreibung, desto besser ist die Qualität des endgültigen Videoprodukts.

Laut Google können Benutzer mit Veo 2 erstellte Videos problemlos auf Social-Media-Plattformen wie TikTok oder YouTube Shorts teilen. Allerdings haben die von Veo 2 erstellten Videos ein Seitenverhältnis von 16:9, das für die Weitergabe auf diesen Videoplattformen völlig ungeeignet ist.

hinh-anh-2.png
Der resultierende Befehl: Eine animierte Szene einer winzigen Maus mit übergroßer Brille, die in einem gemütlichen Nest mitten im Wald unter dem schimmernden Licht eines Pilzes ein Buch liest.

Die Funktion zur Videoerstellung wird jetzt für Gemini Advanced-Benutzer weltweit sowohl auf Web- als auch auf Mobilplattformen eingeführt. Diese Funktion ist jedoch nur für Abonnenten des Google One AI Premium-Plans mit der vollständigen Sprachunterstützung verfügbar, die Gemini derzeit bietet.

Derzeit wird Veo 2 von Google für Gemini Advanced-Benutzer bereitgestellt. Der Servicepreis beträgt in Vietnam 489.000 VND/Monat.

Zusätzlich zu Veo 2 hat Google auch ein KI-Tool namens Whisk Animate herausgebracht, mit dem Benutzer neue Bilder mit beschreibendem Text erstellen und dieses Bild dann in ein Video mit flüssigen Bewegungen umwandeln können, das aber, ähnlich wie Veo 2, nur eine maximale Länge von 8 Sekunden hat.

Whisk, ein Ende 2024 startendes Experiment von Google Labs, hilft Benutzern, neue Ideen mithilfe von Text- und Bildaufforderungen schnell zu erkunden und zu visualisieren. Benutzer können ihre Ideen mit der Whisk Animate-Funktion zum Leben erwecken.

Whisk Animate bietet die Möglichkeit, Standbilder der Benutzer mithilfe der Veo 2-Technologie in 8-Sekunden-Livevideos umzuwandeln. Die Funktion ist für Google One AI Premium-Abonnenten in mehr als 60 Ländern verfügbar.

hinh-anh-3.png
Videos bestehen aus Fotos.

Google sagte außerdem, es habe wichtige Maßnahmen umgesetzt, um ein sicheres Erlebnis bei der Videoerstellung zu gewährleisten. Hierzu gehören Red Teaming und eingehende Überprüfungen, um die Erstellung von Inhalten zu verhindern, die gegen die Richtlinien von Google verstoßen. Darüber hinaus wird jedes mit Veo 2 erstellte Video mit SynthID gekennzeichnet, einem in jedes Bild eingebetteten digitalen Wasserzeichen, das eindeutig darauf hinweist, dass es KI-generiert ist./.

(Vietnam+)

Quelle: https://www.vietnamplus.vn/google-gioi-thieu-cong-cu-ai-chuyen-doi-van-ban-thanh-video-tu-gemini-advanced-post1033671.vnp


Kommentar (0)

No data
No data

Gleiche Kategorie

Viele Strände in Phan Thiet sind voller Drachen, was die Touristen beeindruckt.
Russische Militärparade: „Absolut filmische“ Winkel, die die Zuschauer verblüfften
Sehen Sie sich den spektakulären Auftritt russischer Kampfjets zum 80. Jahrestag des Sieges an
Cuc Phuong in der Schmetterlingssaison – wenn sich der alte Wald in ein Märchenland verwandelt

Gleicher Autor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt