A ChatGPT új következtetési modellje

Sok felhasználó szerint az O3 Pró számos területen jobb a többi chatbotnál. Ennek a modellnek azonban van egy jelentős hátránya és specifikus alkalmazásai.

ZNews•16/06/2025

Az o3 pro kiemelkedik a komplex kérések kezelésének képességével. Kép: OpenAI.

Az OpenAI bemutatta az o3 Pro-t Pro csomagban, havi 200 dolláros áron, Team via API-val. Az o3 néhány hónappal ezelőtt bemutatott továbbfejlesztett verzióját, az o3 Pro-t a vállalat a jelenleg elérhető legerősebb verzióként emlegeti.

Minden olyan verzió, amelyhez a „pro” szó hozzáadódik, a nehezebb és hosszabb kérdések megválaszolásának képességével társul. A tipikus mesterséges intelligencia alapú verziókkal ellentétben az érvelési modell lépésről lépésre dolgozza fel a problémákat, így stabilabban és megbízhatóbban működik olyan területeken, mint a fizika, a matematika és a programozás.

„Az o3-pro használatát javasoljuk olyan nehéz kérdések esetén, ahol a megbízhatóság fontosabb a sebességnél, és néhány perc várakozás megéri a kompromisszumot” – nyilatkozta a cég. A megosztott tesztértékelésekben az o3-pro jobb eredményeket ért el az o3 és o1-pro verziókhoz képest.

Ben Hylak, az Apple korábbi alkalmazottja és a Raindrop mesterséges intelligencia fejlesztő cég társalapítója az új modellről azt nyilatkozta, hogy sokkal okosabb. Összegyűjtötte a cégénél korábban tartott összes megbeszélés előzményeit, majd megkérte az o3-pro-t, hogy készítsen egy tervet.

Az eredmények meglehetősen lenyűgözőek, specifikusak és világosan elemzettek voltak – pont olyanok, amilyeneket mindig is remélt egy nagyszabású nyelvi modellezéstől (LLM). A terv tartalmazott célzott mutatókat, határidőket, prioritásokat és szigorú útmutatást arra vonatkozóan, hogy mit kell teljesen kiküszöbölni. „Annyira specifikus és megalapozott volt, hogy újra kellett gondolnom a vállalatom jövőjét” – írta.

új érvelési modell kép 1

Az o3 pro-val (balra) kapott eredmények konkrétabbak és megbízhatóbbak. Fotó: Ben Hylak/X.

Az O3-pro befektetett tokenenként 20 dollárba, exportált tokenenként pedig 80 dollárba kerül, ha API-n keresztül használják. Ez a mesterséges intelligencia adatmemorizáló és -feldolgozó képességének köszönhető. Egymillió befektetett token körülbelül 750 000 szónak felel meg, ami a The Verge összehasonlítása szerint még a *Háború és béke* című könyvnél is hosszabb.

Az OpenAI kijelenti, hogy a szakértők minden tesztelt kategóriában következetesen magasabb értékelést adnak az o3 pro-nak, mint az o3. A tesztelők az o3 pro-nak több kritérium – például az érthetőség, a követhetőség és a pontosság – következetességét is magasabbra értékelik, különösen olyan kulcsfontosságú területeken, mint a tudomány, az oktatás , a programozás, az üzlet és az írástámogatás.

Az AIME 2024 teszten, amely a modell matematikai képességeit vizsgálta, az o3 pro még a Google legjobb mesterséges intelligenciáját, a Gemini 2.5 Pro-t is felülmúlta. Ezenkívül a modell felülmúlta az Anthropic Claude 4 Opusát a GPQA Diamond doktori szintű tudományos tudásteszten.

Az o3 pro olyan eszközöket is integrál, amelyek lehetővé teszik a webes keresést, fájlok elemzését, Python használatát számításokhoz és programozáshoz, valamint a memória kihasználásával személyre szabható válaszokat. Ezzel a szemponttal kapcsolatban Ben Hylak megjegyezte, hogy az eszköz egyértelműen demonstrálja a környezetének felismerésére való képességét, annak a képességét, hogy mikor kell kérdezni a külvilágról (ahelyett, hogy úgy tenne, mintha tudná), és az egyes feladatokhoz a megfelelő eszköz kiválasztását.

A modell legnagyobb hátránya azonban a válaszideje, amely még az o1 Pro-nál is lassabb. Bijan Bowen YouTuber egyetért ezzel. „Bár a modell válasza meglehetősen egyértelmű, mindössze néhány leíró mondaton belül, a válaszidő meglehetősen hosszú” – mondta. Különösen a nem elegendő külső adat esetén hajlamos a modell túlgondolni magát – tette hozzá Ben Hylak.

Az O3-pro-nak vannak további korlátai is, például a képek létrehozásának lehetetlensége, valamint a Canvas funkció támogatása. A ChatGPT-ben a modell ideiglenes csevegési funkciója jelenleg le van tiltva, amíg az OpenAI kijavít egy „technikai problémát”.

Hylak azonban azzal érvel, hogy ez nem egy olyan felhasználóbarát csevegési modell, mint a Claude 3.5 Sonnet vagy a ChatGPT 4o. Nate B. Jones, a Rockerbox termékvezetője azt tanácsolja, hogy az o3 pro-t olyan kihívást jelentő feladatokhoz használják, amelyek 15-20 perc gondolkodási időt igényelnek.

Forrás: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html