Vietnam.vn - Nền tảng quảng bá Việt Nam

Das neue Inferenzmodell von ChatGPT

o3 pro wird von vielen Nutzern in einigen Bereichen als anderen Chatbots überlegen angesehen. Dieses Modell hat jedoch einen großen Nachteil und eine eigene Anwendung.

ZNewsZNews16/06/2025

o3 pro zeichnet sich durch die Fähigkeit aus, komplexe Anfragen zu verarbeiten. Foto: OpenAI.

OpenAI hat o3 pro in seinem Pro-Paket für 200 US-Dollar/Monat und Team über API eingeführt. Als verbesserte Version des vor einigen Monaten eingeführten o3 gilt o3 pro laut Unternehmen als die bisher leistungsstärkste Version.

Alle Versionen mit dem Tag „Pro“ sind mit der Fähigkeit verbunden, schwierigere und längere Fragen zu beantworten. Im Gegensatz zu herkömmlichen KI-Versionen lösen Inferenzmodelle Probleme Schritt für Schritt, wodurch sie in Bereichen wie Physik, Mathematik und Programmierung zuverlässiger und konsistenter funktionieren.

„Wir empfehlen den o3-pro für schwierige Fragen, bei denen Zuverlässigkeit wichtiger ist als Geschwindigkeit und ein paar Minuten Wartezeit den Kompromiss wert sind“, sagte das Unternehmen. In gemeinsamen Testberichten übertraf der o3-pro die Versionen o3 und o1-pro.

Ben Hylak, ein ehemaliger Apple-Mitarbeiter und Mitgründer des KI-Startups Raindrop, sagte, das neue Modell sei deutlich intelligenter. Er sammelte alle bisherigen Meetings in seinem Unternehmen und bat o3-pro, einen Plan zu erstellen.

Die Ergebnisse waren beeindruckend, so spezifisch und analytisch, wie er es sich von einem großen Sprachmodell (LLM) erhofft hatte. Der Plan enthielt Zielvorgaben, Zeitpläne, Prioritäten und strikte Anweisungen, was vollständig gestrichen werden sollte. „Er war so spezifisch und fundiert, dass ich die Zukunft meines Unternehmens überdenken musste“, schreibt er.

neues Schlussfolgerungsmodell Bild 1

Die Ergebnisse des o3 pro (links) sind spezifischer und fundierter. Foto: Ben Hylak/X.

O3-pro kostet 20 Dollar pro 1 Million Eingabetoken und 80 Dollar pro 1 Million Ausgabetoken bei Nutzung über API. Das ist die Fähigkeit der KI, Daten zu speichern und zu verarbeiten. Eine Million Eingabetoken entsprechen etwa 750.000 Wörtern, was länger ist als das Buch „Krieg und Frieden“ , verglich The Verge .

OpenAI schreibt, dass Experten dem o3 pro in jeder getesteten Kategorie durchweg eine höhere Bewertung gaben als dem o3. Die Prüfer gaben dem o3 pro auch eine höhere Bewertung für Konsistenz in einer Reihe von Kriterien, darunter Klarheit, einfache Befolgung der Anweisungen und Genauigkeit, insbesondere in Schlüsselbereichen wie Wissenschaft, Bildung , Programmierung, Wirtschaft und Schreibunterstützung.

Bei AIME 2024, einem Test zur Bewertung der mathematischen Fähigkeiten eines Modells, schnitt der o3 pro besser ab als der Gemini 2.5 Pro, Googles KI-Flaggschiff. Darüber hinaus übertraf das Modell auch Anthropics Claude 4 Opus bei GPQA Diamond, einem Test für wissenschaftliches Wissen auf Doktoratsniveau.

o3 pro verfügt außerdem über integrierte Tools, die es ermöglichen, im Internet zu suchen, Dateien zu analysieren, Python für Berechnungen und Programmierung zu verwenden und Antworten durch die Nutzung des Speichers zu personalisieren. Ben Hylak kommentierte hierzu, dass das Tool seine Fähigkeit deutlich demonstriere, seine Umgebung zu erkennen, wann es nach der Außenwelt fragen sollte (anstatt so zu tun, als wüsste es Bescheid) und für jede Aufgabe das richtige Tool auszuwählen.

Größter Nachteil des Modells ist jedoch seine Reaktionszeit, die sogar langsamer ist als beim o1 pro. YouTuber Bijan Bowen sieht das ähnlich. „Obwohl die Antwort des Modells in wenigen Sätzen recht klar ist, ist die Reaktionszeit recht lang“, sagte er. Insbesondere bei unzureichenden externen Daten neige das Modell dazu, zufällig zu denken, ergänzte Ben Hylak.

Der O3-pro weist außerdem einige weitere Einschränkungen auf, wie z. B. die fehlende Fähigkeit zur Bildgenerierung sowie die Unterstützung der Canvas-Funktion. Die temporäre Chat-Funktion von ChatGPT ist bei diesem Modell derzeit deaktiviert, während OpenAI ein „technisches Problem“ behebt.

Herr Hylak sagte jedoch, dass dies kein Modell für Benutzer zum Chatten wie Claude 3.5 Sonnet oder ChatGPT 4o sei. Nate B. Jones, Produktleiter bei Rockerbox, riet, o3 pro für schwierige Aufgaben zu verwenden, die 15 bis 20 Minuten Denkzeit erfordern.


Quelle: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html


Kommentar (0)

No data
No data
Bewundern Sie den Millionen Jahre alten Vulkan Chu Dang Ya in Gia Lai
Vo Ha Tram brauchte sechs Wochen, um das Musikprojekt zur Lobpreisung des Vaterlandes fertigzustellen.
Das Café in Hanoi ist hell mit roten Fahnen und gelben Sternen, um den 80. Jahrestag des Nationalfeiertags am 2. September zu feiern
Flügelfliegen auf dem A80-Trainingsgelände
Besondere Piloten in der Flugformation zur Feier des Nationalfeiertags am 2. September
Soldaten marschieren durch die heiße Sonne auf dem Übungsgelände
Beobachten Sie Hubschrauberübungen am Himmel von Hanoi zur Vorbereitung auf den Nationalfeiertag am 2. September
U23 Vietnam holt strahlend den Pokal der Südostasiatischen U23-Meisterschaft nach Hause
Die nördlichen Inseln sind wie „rohe Edelsteine“, billige Meeresfrüchte, 10 Minuten mit dem Boot vom Festland entfernt
Die mächtige Formation von 5 SU-30MK2-Kampfflugzeugen bereitet sich auf die A80-Zeremonie vor

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt