Liste der auf Gemini verfügbaren Modelle. |
Gemini 2.5 Flash ist eines der neuen KI-Modelle von Google. Mit seinen Inferenzfähigkeiten kann das Modell mehrere Anwendungen wie Google Search, Google Maps und YouTube verbinden.
Dank dieser Funktion können Benutzer Gemini bitten, Videos auf YouTube zusammenzufassen, insbesondere wenn sie beim Ansehen langer Videos Zeit sparen möchten.
Um das Modell zu verwenden, besuchen Sie einfach die Gemini-Website, wenn Sie einen Computer verwenden, oder laden Sie die gleichnamige App für iOS oder Android herunter. Tippen Sie anschließend auf den Modellnamen in der oberen linken Ecke und wählen Sie Gemini 2.5 Flash (Experimental) aus.
Zusammenfassung der Sporthighlights
Im Web können Benutzer eine Anfrage für den Chatbot eingeben und dann den Videolink per Drag & Drop verschieben, während auf Mobilgeräten der Link kopiert werden muss.
Beispielsweise kann Gemini gebeten werden, die wichtigsten Ereignisse in Sport-Highlight-Videos zusammenzufassen, die etwa 5 bis 20 Minuten lang sind.
Geben Sie einfach einen Befehl wie „Was ist in diesem Spiel passiert?“ ein, fügen Sie dann den Videolink ein und drücken Sie die Eingabetaste . Sekunden später liefert Gemini Ergebnisse mit einigen Highlights sowie entsprechenden Zeitstempeln im Video.
![]() |
Die Fähigkeit von Gemini, die Highlights von Sportvideos zusammenzufassen. |
Benutzer können Gemini bitten, weiterhin bestimmte Themen zu aggregieren. Beispielsweise konnte der Chatbot zwar den ersten Spieler angeben, der einen Schuss abgegeben hat, der Zeitstempel wich jedoch um einige Sekunden von der Zeit im Video ab.
Es ist wahrscheinlich, dass das Tool auf Kommentare angewiesen ist, um Sportvideos zu aggregieren, sodass die Zeitleiste auch auf den Worten des Kommentators und nicht auf dem eigentlichen Bild basiert.
Mithilfe seiner Argumentations- und Synthesefunktionen können Benutzer Gemini bitten, im Internet Informationen zu videobezogenen Themen zu finden.
Lange Videozusammenfassung
Als nächstes kann Gemini lange Videos zusammenfassen. Bei einem Podcast von 1 Stunde und 40 Minuten benötigt das Tool nur wenige Sekunden, um die wichtigsten besprochenen Themen und Inhalte zusammenzufassen.
Wenn Sie das Feedback lückenhaft und unvollständig finden, können Sie Gemini bitten, es ausführlicher zusammenzufassen. Zu jedem Thema gibt es im Video außerdem eine entsprechende Zeitleiste zur schnellen Verfolgung.
![]() |
Die Fähigkeit von Gemini, fast 2 Stunden Video-Podcasts zusammenzufassen. |
Gemini basiert weiterhin auf Sprach- oder Textübersetzung und nicht auf der tatsächlichen Analyse von Videobildern. So lieferte die KI beispielsweise keine Details zum Moderatorenteam der Show, obwohl deren Namen im Video auftauchten, und listete nicht einmal den gesamten Hauptinhalt auf, obwohl dieser in der Beschreibung erwähnt wurde.
Im Gegenzug leistet Gemini hervorragende Arbeit bei der schnellen Zusammenfassung von Audiodaten aus Videos, einschließlich detaillierter Analysen, falls weitere Informationen gewünscht werden.
Natürlich können Benutzer Gemini zusätzlich zu Podcasts bitten, auch andere lange Videos wie Tutorials oder technische Analysen zusammenzufassen, um die Hauptidee zu erfassen und bei Bedarf auf zusätzliche Informationen zu verweisen.
Zusammenfassung des Videointerviews
Auch Interviewvideos sind ein Genre, das häufig einer Zusammenfassung bedarf. Mit seinen Audioanalysefunktionen kann Gemini die Höhepunkte im Interviewvideo des Schauspielers recht gut synthetisieren, da das Interviewvideo viel Sprache enthält.
![]() |
Funktionen zur Video-Interview-Zusammenfassung von Gemini. |
Dies ist jedoch auch der einzige Vorteil von Gemini. Dieses Tool kann derzeit keine anderen Elemente in einem Video als Audio analysieren, wie etwa Intervieworte, Ausdrücke, Aktionen von Personen im Video oder Details im Zusammenhang mit dem Bild.
Insgesamt leistet Gemini gute Arbeit bei der Zusammenfassung von Audiodaten aus YouTube-Videos und analysiert und ruft gleichzeitig relevante Informationen ab, sofern diese mündlich erwähnt werden. Auch bei visuell dargestellten Informationen müssen sich die Nutzer das Video ansehen, um den gesamten Inhalt zu erfassen.
Quelle: https://znews.vn/tom-tat-video-youtube-mien-phi-voi-gemini-post1549612.html
Kommentar (0)