![]() |
CEO Sundar Pichai spricht auf der Google I/O 2026. Foto: Android Central . |
Auf der I/O 2026 Konferenz, die in den frühen Morgenstunden des 20. Mai (vietnamesischer Zeit) stattfand, kündigte Google die neueste Version von Gemini zusammen mit einem KI-Modell namens Omni an, das die physische Welt simuliert.
Laut CNET fand das Ereignis statt, als Google darum kämpfte, mit der Entwicklung von KI-Modellen Schritt zu halten und gleichzeitig seiner riesigen Nutzerbasis mehr Dienste anzubieten.
Ein weiteres Highlight ist die I/O 2026, da der Markt den Fokus auf die rasant steigenden Bewertungen von OpenAI und Anthropic richtet, die beide voraussichtlich noch in diesem Jahr an die Börse gehen werden.
Gemini 3.5 Flash: Schnell und kostengünstig
Googles Fokus liegt weiterhin auf dem Gemini-Ökosystem. Auf der Veranstaltung stellte das Unternehmen Gemini 3.5 Flash vor, eine abgespeckte Version, die nach wie vor leistungsstark ist und dabei nur die Hälfte oder sogar ein Drittel des Preises vergleichbarer, fortschrittlicherer Modelle kostet.
Im Vorfeld der Veranstaltung erklärte CEO Sundar Pichai gegenüber Reportern, dass Gemini 3.5 Flash „unglaublich schnell“ sei. Google gab an, dass dies weltweit das Standardmodell in Gemini und im KI-Modus der Google-Suche sein werde.
„Sie müssen nicht länger zwischen Qualität und Geschwindigkeit wählen“, betonte Google in seiner Ankündigung. Das Unternehmen erklärte, dass der Schutz vor Cyberangriffen in Gemini 3.5 Flash verbessert wurde, wodurch die Erstellung schädlicher Inhalte und die fälschliche Ablehnung normaler Befehle reduziert werden.
![]() |
Der Gemini 3.5 Flash zeichnet sich durch seine hohe Effizienz und schnelle Ausgabegeschwindigkeit aus. Bild: Google . |
Gemini 3.5 Flash ist für komplexe agentenbasierte Workflows optimiert. Laut Google übertrifft es Gemini 3.1 Pro in mehreren Benchmarks, wie beispielsweise Terminal-Bench 2.1 (76,2 % gegenüber 70,3 %) und MCP Atlas (83,6 % gegenüber 78,2 %).
Gemini 3.5 Flash ist hinsichtlich der Anzahl der pro Sekunde ausgegebenen Token viermal schneller als einige neuere Modelle. Laut Google kann das Modell die Bearbeitungszeit von Aufgaben, die zuvor Tage oder Wochen dauerten, deutlich verkürzen und ist dabei kostengünstiger. Dadurch eignet es sich ideal für Programmierer, Unternehmen, Wissenschaftler und Endnutzer gleichermaßen.
„Um das Ganze in Relation zu setzen: Große Unternehmen verarbeiten täglich rund eine Billion Token. Würden sie 80 % dieser Arbeitslast auf 3.5 Flash migrieren, könnten sie über eine Milliarde Dollar pro Jahr einsparen – ein beträchtlicher Kapitalbetrag, der direkt in das Unternehmen reinvestiert werden könnte“, betonte Pichai.
Nach Gemini 3.5 Flash gab Google bekannt, dass Gemini 3.5 Pro in Entwicklung ist und intern getestet wird; eine breite Veröffentlichung wird im Juni erwartet.
Zwillinge-Expansion
Die Gemini-App wurde mit einer neuronalen Ausdruckssprache neu gestaltet. Neu ist auch Gemini Spark, ein permanent aktiver, persönlicher KI-Agent. Diese Funktion läuft auf der Gemini-3.5-Plattform und kann direkt mit Gmail, Google Docs oder Slides verbunden werden.
Das Besondere an Gemini Spark ist seine Fähigkeit, im Hintergrund zu laufen, sodass es auch dann funktioniert, wenn der Benutzer sein Telefon oder seinen Computer sperrt.
Zu den Anwendungsbereichen von Spark gehören die Analyse monatlicher Kreditkartenabrechnungen, um Sie auf Abonnementgebühren oder versteckte Kosten aufmerksam zu machen, das Überprüfen von E-Mails, um wichtige Informationen zu extrahieren und zusammenzufassen, das Zusammenfassen von Besprechungen und deren Dokumentation in Google Docs und vieles mehr.
![]() |
Neue Funktionen in Kürze in der Gemini-App. Foto: Google . |
Auf Android können Nutzer Live-Updates und den Fortschritt von Aufgaben von Akteuren wie Spark über eine neue Benutzeroberfläche namens Android Halo verfolgen, die voraussichtlich noch in diesem Jahr auf den Markt kommen wird.
Bis Ende dieses Sommers wird Spark auch direkt in Chrome laufen und den Browser in einen Agenten verwandeln, der Nutzern im Internet hilft.
Um die Privatsphäre zu gewährleisten, können Nutzer die Aktivierung von Gemini Spark deaktivieren und auswählen, welche Apps verbunden werden. Diese Funktion wird voraussichtlich ab Ende Mai für Abonnenten von Google AI Ultra in den USA verfügbar sein.
Die neue Funktion „Tägliche Zusammenfassung“ in Gemini bietet Ihnen jeden Morgen eine personalisierte Übersicht. Die Informationen werden aus E-Mails und Kalendereinträgen zusammengestellt und in einem prägnanten Bericht zusammengefasst.
![]() |
Die Funktion „Tageszusammenfassung“ in der Gemini-App. Foto: Google . |
Nutzer können priorisierte Informationstypen anfordern und die KI sogar bei den nächsten Verarbeitungsschritten anleiten. Aktuell unterstützt Daily Brief in den USA nur die Abonnements AI Plus, Pro und Ultra.
Google hat außerdem mehrere Aktualisierungen der Gemini-App für macOS vorgestellt, darunter die Integration von Gemini Spark zur Verarbeitung und Automatisierung von Arbeitsabläufen.
Das Spracherkennungssystem von Rambler wird auch unter macOS unterstützt und ist in der Lage, überflüssige Wörter zu entfernen, um Sprache reibungsloser in Text umzuwandeln.
Erstellen Sie Videos mit Gemini Omni
Gemini Omni ist ein Modell, das die physikalische Welt simuliert. DeepMind hat bereits mehrere ähnliche Modelle entwickelt, jedoch ausschließlich für den Einsatz in Robotik und Spielen.
Mit Omni können Nutzer Bilder, Audio und Text kombinieren, um auf Basis der realen Wissensdatenbank von Gemini hochwertige Videos zu erstellen.
Laut Google kann Omni die Gesetze der Physik, wie Schwerkraft, kinetische Energie und Fluiddynamik, präzise auf den jeweiligen Kontext anwenden. Dank der aus Gemini gewonnenen Erkenntnisse ist das Modell in der Lage, nachfolgende Ereignisse vorherzusagen.
![]() |
Ein Video erstellt von Gemini Omni. Foto: Google . |
Das Modell unterstützt die Bearbeitung in natürlicher Sprache, und der Kontext bleibt bei jeder Bearbeitung erhalten. Über Befehle können Benutzer auf einfache Weise Charaktere hinzufügen, Objekte einfügen oder die Szene ändern.
Omni unterstützt auch die Erstellung virtueller Avatare mit realistischem Aussehen und realistischer Stimme. Alle Videos enthalten ein SynthID-Wasserzeichen zur Kennzeichnung KI-generierter Inhalte.
Google gibt an, dass die erste Version, genannt Gemini Omni Flash, in den Apps Gemini, Flow und YouTube Shorts implementiert wird. Zukünftig wird dieses Modell sowohl Video- als auch Audioausgabe unterstützen.
![]() |
Google hebt die Fähigkeit von Gemini Omni hervor, die physikalische Welt präzise zu simulieren. Foto: Google . |
Die steigenden Investitionskosten von Google haben an der Wall Street hohe Erwartungen geweckt. Laut CNET erwarten Investoren, dass das Unternehmen KI tiefgreifend in seine Kernprodukte integriert, um nachhaltige Gewinne zu erzielen. Agenten-Tools könnten dabei eine entscheidende Rolle spielen.
Intelligente Agenten wie Spark und Daily Brief sind Googles Antwort. Durch die Kombination von kostengünstigem Gemini 3.5 Flash und Omni will das Unternehmen seine Position gegenüber dem Wettbewerb behaupten.
Nicht nur Google stellt hohe Erwartungen an KI-Unternehmen, insbesondere nach der Ankündigung von Mythos durch Anthropic. Dieses Modell soll so leistungsstark sein, dass es Tausende von bisher unbekannten Sicherheitslücken in der globalen Softwareinfrastruktur aufdecken kann.
Quelle: https://znews.vn/gemini-vuot-khoi-ranh-gioi-chatbot-post1652959.html













Kommentar (0)