![]() |
Google Gemini-Logo. Foto: Bloomberg . |
Google brachte das Gemini 3-Modell Ende November auf den Markt. Das Unternehmen präsentierte eine Reihe bemerkenswerter Verbesserungen, darunter optimierte Codierungsfunktionen, Visualisierungsmöglichkeiten und Agenten, die bestimmte Aufgaben im Auftrag der Nutzer ausführen.
Bei der Vorstellung von Gemini 3 betonte Google, dass dies das bisher intelligenteste Modell des Unternehmens sei. Die praktische Erfahrung zeigt, dass das Modell schneller arbeitet und ein besseres Denkvermögen besitzt, obwohl es einige Faktoren gibt, die noch verbessert werden müssen.
Schnell interaktive Benutzeroberflächen erstellen
Eine der wichtigsten Neuerungen in Gemini 3 betrifft Canvas, einen interaktiven Arbeitsbereich in Gemini, mit dem man Chatbots bitten kann, Code zu schreiben, Ergebnisse zu visualisieren und Inhalte zu bearbeiten.
Wenn Gemini 3 aufgefordert wird, ein 3D-Modell des Größenunterschieds zwischen einem Fußball, der Erde, der Sonne und der Milchstraße zu erstellen, löst das Tool eine interaktive Codierungs-, Verarbeitungs- und Erstellungsschnittstelle aus, die es ermöglicht, Objekte auszuwählen und ihre Größe zu vergleichen.
![]() |
Die Möglichkeit, mit der Canvas-Funktion in Gemini 3 interaktive Räume zu erstellen. |
Im Vergleich zur Google-Demo ist die Bildqualität etwas schlechter. Dafür werden die Informationen zu den Objekten klar und verständlich dargestellt. Die Verarbeitungszeit beträgt etwa 2 Minuten. In der Canvas-Oberfläche können Nutzer den Code direkt bearbeiten sowie Inhalte kopieren oder teilen.
Mit einem weiteren Befehl wurde Gemini 3 aufgefordert, einen Adler im Voxel-Stil auf einem Ast zu erstellen. Das Tool lieferte nach etwa 45 Sekunden Ergebnisse, und die Benutzer konnten die Ansicht mit der Maus vergrößern und drehen. Allerdings wiesen einige Details im Bild Grafikfehler auf und wurden nicht korrekt dargestellt.
Ebenfalls mit einem Adler auf einem Ast, allerdings mit einer schwierigeren Aufgabe (3D-Modell). Beim ersten Versuch stürzte der von Gemini 3 generierte Code ab und konnte nicht ausgeführt werden. Nach einer Korrekturanfrage wurde das Bild angezeigt und war interaktiv.
![]() |
Die Möglichkeiten von Gemini 3 zur Erstellung interaktiver Umgebungen. |
Auch wenn es einige Probleme gibt, ist der Übergang von einem Frage-Antwort-Modell zu einer kollaborativen Bearbeitung eine interessante Richtung, die Gemini 3 für komplexe, langfristige Aufgaben nützlich machen wird.
Gemini 3 dient natürlich nicht nur der Erstellung von Grafiken oder visuellen Modellen. Google testet derzeit eine Funktion namens „Generative UI“ für AI Pro-Nutzer. Mit wenigen Befehlen kann das Modell interaktive Benutzeroberflächen im Magazinstil oder visuelle Websites erstellen.
Google gibt an, die Funktion schrittweise einzuführen. Wie The Verge feststellte, müssen Nutzer die Funktion „Visuelles Layout“ auswählen und anschließend einen Befehl wie „Plane mir eine 3-tägige Reise nach Rom“ eingeben.
Nach der Verarbeitung generiert Gemini 3 Ergebnisse, die einer Reise- Website ähneln, mit detaillierten Fahrplänen und Bildern sowie Fragen zu Reisevorlieben und Essgewohnheiten. Anschließend passt das Modell die Antworten entsprechend an. Diese Funktion ist auch für Themen wie den Zusammenbau eines Computers oder den Bau eines Aquariums sehr nützlich.
Effektiver argumentieren und analysieren
Laut Google verfügt das Gemini 3 über bessere Denkfähigkeiten als sein Vorgänger. Das Unternehmen behauptet, die Denkfähigkeit des Gemini 3 Pro entspreche Doktorgrad, mit 37,5 % im Humanity's Last Exam und 91,9 % im GPQA Diamond-Test.
Den Unterschied bemerken Nutzer natürlich erst bei der direkten Interaktion mit dem Modell. Bei der Bearbeitung einer Aufgabe aus dem GPQA Diamond Referenzset (für Doktoranden) lieferte Gemini 3 Pro in etwa 30 Sekunden eine detaillierte Lösung inklusive aller Lösungsschritte und anschaulicher Abbildungen.
![]() |
Zwillinge 3 können komplexe Fragen beantworten, ihr Denkvermögen entspricht dem eines Doktors. |
Laut Auswertung ist die Lösung sehr detailliert und folgt dem vorgegebenen Verfahren. Zum Vergleich: GPT-5.1 benötigte ebenfalls etwa 30 Sekunden, beantwortete die Aufgabe korrekt, die Lösung war jedoch weniger detailliert. Ähnlich verhielt es sich mit Claude 4.5 Sonnet: Die Antwort war korrekt, schneller als bei Gemini 3, aber weniger detailliert.
Laut Google kann Gemini 3 Dokumente aus mehreren Quellen gleichzeitig extrahieren, darunter Text, Bilder und Videos . Auch Aufgaben, für die es zuvor noch nicht trainiert wurde, bewältigt Gemini 3 besser.
![]() |
Gemini 3 Videoanalysefunktionen. |
Als Gemini 3 beispielsweise aufgefordert wurde, das Hauptthema eines 57-minütigen Videos zu analysieren, benötigte es nur etwa eine Minute, um ein Ergebnis zu liefern, das die angeforderten Argumente sowie einen Zeitstempel zur entsprechenden Stelle im Video enthielt. Ebenso identifizierte das Modell korrekt ein Video über Tennis, indem es die Spiele und die Spielweise der einzelnen Spieler analysierte.
Nutzer können Gemini 3 bitten, Videos anzusehen und dabei externe Quellen einzubinden, und sogar Fragen für eine tiefergehende Analyse stellen. Insgesamt reagiert Gemini 3 sehr schnell bei der Analyse und dem Einbinden von Dokumenten, was unter anderem auf die Anbindung an die Google-Suchdatenbank zurückzuführen ist.
Der Agent ist hilfsbereit, hat aber Probleme.
Der Agentenmodus ist ebenfalls eine bemerkenswerte Verbesserung gegenüber Gemini 3. Für Nutzer des AI Ultra-Pakets (derzeit nur für den US-Markt verfügbar) kann dieser Modus komplexe Prozesse im Auftrag der Nutzer durchführen, wie z. B. das Sortieren und Organisieren von E-Mails, die Informationssuche und die Buchung von Reisetickets.
Als Google Gemini 3 auf den Markt brachte, demonstrierte das Unternehmen die Möglichkeit, den Posteingang in Gmail zu organisieren, und nach den Erfahrungen von The Verge funktionierte es genau so, wie es sollte: Es generierte eine vollständige Liste der ungelesenen E-Mails der vergangenen Woche.
Ähnlich wie bei der Canvas-Funktion werden die E-Mail-Liste und die Aktionsvorschläge in einem separaten Bereich angezeigt. Gemini bietet einige Optionen, wie z. B. das Festlegen von Erinnerungen für wichtige E-Mails und das Archivieren von Werbe-E-Mails.
![]() |
Die Agentenfunktion von Gemini 3 unterstützt die Verwaltung des Gmail-Posteingangs. Foto: The Verge . |
Wenn Gemini aufgefordert wird, eine Zahlungserinnerung zu erstellen, werden die relevanten Informationen schnell in Google Tasks übernommen. Für die Zahlungsaufgabe navigiert der Agent automatisch und stoppt, sobald der Nutzer die Zahlungsinformationen eingeben muss.
Insgesamt ist der Gemini 3-Agent sehr nützlich, um E-Mails zu erkennen, die Nutzer wahrscheinlich vergessen. Das Tool kann außerdem E-Mails von Werbeadressen finden und die Abmeldung von nicht mehr benötigten Absendern veranlassen.
Tatsächlich unterstützen einige Chatbot-Agenten wie Perplexity und ChatGPT bereits die Gmail-Integration. Gemini bietet jedoch die vielfältigsten Integrationsmöglichkeiten. So müssen Perplexity-Nutzer beispielsweise die zu behaltenden oder zu löschenden E-Mails explizit eingeben, während dies bei Gemini per Knopfdruck möglich ist.
![]() |
Die Funktion zur Erstellung interaktiver Benutzeroberflächen von Gemini 3. Foto: The Verge . |
Die E-Mail-Planungsfunktion von ChatGPT ist ebenfalls unzuverlässig. Die E-Mail-Zustellungsgeschwindigkeit von Gemini ist jedoch langsamer als die von Perplexity. Bei manchen Aufgaben, wie beispielsweise Restaurantreservierungen, treten gelegentlich Probleme auf.
Obwohl vor sensiblen Aktionen wie Zahlungen oder dem Versenden von E-Mails stets eine Benutzerbestätigung erforderlich ist, zögern Nutzer weiterhin, bestimmte Aufgaben der KI zu überlassen. Der Agentenmodus von Gemini 3 ist zwar sehr nützlich, die Nutzer müssen die Ergebnisse aber dennoch überwachen.
Quelle: https://znews.vn/gemini-3-tot-den-dau-post1607493.html

















Kommentar (0)