ChatGPTs größter Konkurrent

Das Google Gemini-Logo. Foto: Bloomberg .

Google brachte das Gemini 3-Modell Ende November auf den Markt. Das Unternehmen stellte eine Reihe bemerkenswerter Verbesserungen vor, darunter verbesserte Codierungsfunktionen, visuelle Bildbearbeitung und Agenten, die bestimmte Aufgaben im Auftrag des Benutzers ausführen.

Bei der Vorstellung von Gemini 3 betonte Google, dass es sich um das bisher intelligenteste Modell des Unternehmens handele. Die Praxiserfahrung zeigt, dass das Modell schneller arbeitet und über bessere Denkfähigkeiten verfügt, obwohl es noch einige Bereiche mit Verbesserungspotenzial gibt.

Erstellen Sie schnell interaktive Benutzeroberflächen.

Eine der wichtigsten Neuerungen in Gemini 3 betrifft Canvas. Dabei handelt es sich um einen interaktiven Arbeitsbereich innerhalb von Gemini, mit dem Sie Chatbots Code schreiben lassen, Ergebnisse visualisieren und Inhalte bearbeiten können.

Wenn Gemini 3 aufgefordert wird, ein 3D-Modell der Größenunterschiede zwischen einem Fußball, der Erde, der Sonne und der Milchstraße zu erstellen, aktiviert das Tool eine Codierungsschnittstelle, verarbeitet die Daten und erstellt eine interaktive Umgebung, in der die Benutzer die Größen der Objekte auswählen und vergleichen können.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 1

Die Möglichkeit, mit der Canvas-Funktion in Gemini 3 interaktive Bereiche zu erstellen.

Im Vergleich zur Google-Demo ist die Bildqualität etwas geringer. Die Informationen zu den Objekten sind jedoch klar und leicht verständlich. Die Verarbeitungszeit beträgt etwa 2 Minuten. In der Canvas-Oberfläche können Nutzer den Code direkt bearbeiten, Inhalte kopieren oder teilen.

Mit einem weiteren Befehl wurde Gemini 3 aufgefordert, ein dreidimensionales Voxelmodell eines auf einem Ast sitzenden Adlers zu erstellen. Das Tool lieferte das Ergebnis in etwa 45 Sekunden, und die Benutzer konnten die Ansicht mit der Maus vergrößern und drehen. Allerdings wiesen einige Details im Bild Grafikfehler auf und wurden nicht stabil dargestellt.

Der auf einem Ast sitzende Adler war ebenfalls vorhanden, die Anforderung (ein 3D-Modell) war jedoch anspruchsvoller. Zunächst schlug der von Gemini 3 generierte Code fehl und ließ sich nicht ausführen. Nach einigen Anpassungen erschien das Bild und war interaktiv.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 2

Die Fähigkeit von Gemini 3, interaktive Umgebungen zu schaffen.

Trotz einiger verbleibender Probleme ist der Wechsel von einem Frage-Antwort-Modell zu einem kollaborativen, redaktionell bearbeiteten Ansatz eine interessante Richtung, die Gemini 3 für komplexe, langfristige Aufgaben nützlich macht.

Gemini 3 dient natürlich nicht nur der Erstellung von Grafiken oder visuellen Modellen. Google testet derzeit eine Funktion namens „Generative UI“ für AI Pro-Nutzer. Mit bestimmten Befehlen kann das Modell interaktive Benutzeroberflächen im Magazinstil oder visuelle Websites erstellen.

Google gibt an, dass diese Funktion schrittweise eingeführt wird. Laut The Verge müssen Nutzer die Funktion „Visuelles Layout“ auswählen und anschließend einen Befehl wie „Plane meine 3-tägige Reise nach Rom“ eingeben.

Nach der Verarbeitung generiert Gemini 3 Ergebnisse, die einer Reise- Website ähneln, inklusive Reiserouten, detaillierten Bildern und Fragen zu Reisevorlieben und Essgewohnheiten. Das Modell passt die Antworten anschließend entsprechend an. Diese Funktion ist auch für Themen wie den Zusammenbau eines Computers oder den Bau eines Aquariums sehr nützlich.

Effektivere Argumentation und Analyse.

Laut Google verfügt Gemini 3 über bessere logische Fähigkeiten als sein Vorgänger. Das Unternehmen behauptet, dass die Denkfähigkeit des Gemini 3 Pro ein Doktorandenniveau erreicht und im Humanity's Last Exam 37,5 % sowie im GPQA Diamond-Test 91,9 % erzielt hat.

Den Unterschied erkennen Nutzer natürlich erst richtig, wenn sie direkt mit dem Modell interagieren. Bei der Bearbeitung einer Aufgabe aus dem GPQA Diamond-Referenzfragenkatalog (für Doktoranden) lieferte Gemini 3 Pro innerhalb von etwa 30 Sekunden eine detaillierte Lösung inklusive Schritt-für-Schritt-Anleitung und anschaulichen Abbildungen.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 3

Zwillinge 3 können komplexe Fragen beantworten und demonstrieren Denkfähigkeiten, die einem Doktortitel entsprechen.

Laut Auswertung ist die Lösung sehr detailliert und folgt dem korrekten Verfahren. Zum Vergleich: GPT-5.1 benötigte ebenfalls etwa 30 Sekunden für die richtige Antwort, die Lösung war jedoch weniger detailliert. Ähnlich verhielt es sich mit Claude 4.5 Sonnet: Die Antwort war korrekt und schneller als bei Gemini 3, aber weniger detailliert.

Laut Google kann Gemini 3 Dokumente gleichzeitig aus mehreren Quellen extrahieren, darunter Text, Bilder und Videos . Auch Aufgaben, die zuvor noch nie trainiert wurden, werden von Gemini 3 besser bewältigt.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 4

Die Videoanalysefunktionen von Gemini 3.

Als Gemini 3 beispielsweise gebeten wurde, das Hauptthema eines 57-minütigen Videos zu analysieren, benötigte es nur etwa eine Minute, um Ergebnisse inklusive der angeforderten Argumente und Zeitstempel für den entsprechenden Videoabschnitt zu liefern. Ebenso identifizierte das Modell ein Tennisvideo korrekt und analysierte die Spiele sowie den Spielstil jedes einzelnen Spielers.

Nutzer können Gemini 3 anweisen, gleichzeitig Videos anzusehen und externe Quellen zu konsultieren, und sogar Fragen für eine tiefergehende Analyse stellen. Insgesamt reagiert Gemini 3 bei Analyse- und Dokumentenrecherchen sehr schnell, was unter anderem der Anbindung an die Google-Suchdatenbank zu verdanken ist.

Der Agent ist hilfsbereit, aber es gibt trotzdem noch Probleme.

Die Agentenfunktion ist ebenfalls eine bemerkenswerte Verbesserung gegenüber Gemini 3. Für Nutzer des AI-Ultra-Tarifs (derzeit nur auf dem US-Markt verfügbar) kann dieser Modus komplexe Aufgaben im Namen des Nutzers ausführen, wie z. B. das Kategorisieren und Organisieren von E-Mails, das Suchen nach Informationen und das Buchen von Reisetickets.

Bei der Vorstellung von Gemini 3 nutzte Google die Möglichkeit, den Posteingang in Gmail zu organisieren, als Beispiel. Laut The Verge funktioniert diese Funktion genau wie gewünscht: Sie erstellt eine vollständige Liste aller ungelesenen E-Mails der letzten Woche.

Ähnlich wie bei der Canvas-Funktion werden E-Mail-Listen und Aktionsvorschläge in einem separaten Bereich angezeigt. Gemini bietet verschiedene Optionen, wie z. B. das Festlegen von Erinnerungen für wichtige E-Mails, das Archivieren von Werbe-E-Mails usw.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 5

Die Agentenfunktion von Gemini 3 hilft bei der Verwaltung von Gmail-Postfächern. Bild: The Verge .

Wenn Gemini aufgefordert wird, eine Zahlungserinnerung zu erstellen, trägt es die relevanten Informationen umgehend in Google Tasks ein. Für die Zahlungsaufgabe navigiert der Agent automatisch und stoppt, sobald der Nutzer Zahlungsinformationen eingeben muss.

Insgesamt ist der Agent von Gemini 3 sehr nützlich, um E-Mails aufzuspüren, die Nutzer leicht vergessen. Das Tool kann außerdem E-Mails von Werbeadressen finden und die Abmeldung von diesen Absendern ermöglichen, da diese nicht mehr relevant sind.

Tatsächlich unterstützen einige Chatbots wie Perplexity und ChatGPT bereits die Integration mit Gmail. Gemini bietet jedoch die vielfältigsten Integrationsmöglichkeiten. So müssen Perplexity-Nutzer beispielsweise die E-Mails, die sie behalten oder löschen möchten, explizit eingeben, während diese Aktionen bei Gemini über Schaltflächen ausgeführt werden können.

Gemini 3 la gi, danh gia Gemini 3, mo hinh Gemini 3, Google Gemini 3 Pro anh 6

Die Funktion zur Erstellung interaktiver Benutzeroberflächen von Gemini 3. Foto: The Verge .

Die E-Mail-Sortierfunktion von ChatGPT ist ebenfalls instabil. Die E-Mail-Versandgeschwindigkeit von Gemini ist jedoch langsamer als die von Perplexity. Bei manchen Aufgaben, wie beispielsweise Restaurantreservierungen, treten gelegentlich Probleme auf.

Obwohl vor sensiblen Aktionen wie Zahlungen oder dem Versenden von E-Mails stets eine Benutzerbestätigung erforderlich ist, zögern Nutzer weiterhin, bestimmte Aufgaben an KI zu delegieren. Der Agentenmodus von Gemini 3 ist zwar sehr nützlich, doch die Nutzer müssen die Ergebnisse weiterhin überwachen.

Quelle: https://znews.vn/gemini-3-tot-den-dau-post1607493.html