ChatGPT:s nya inferensmodell

o3 pro utmärker sig för sin förmåga att hantera komplexa förfrågningar. Bild: OpenAI.

OpenAI har lanserat o3 pro i ett Pro-paket till ett pris av 200 dollar/månad med Team via API. O3 pro är en uppgraderad version av o3, som introducerades för några månader sedan, och marknadsförs av företaget som den mest kraftfulla versionen som finns tillgänglig för närvarande.

Alla versioner med tillägget "pro" förknippas med möjligheten att besvara svårare och längre frågor. Till skillnad från typiska AI-versioner bearbetar resonemangsmodellen problem steg för steg, vilket gör att den kan fungera mer stabilt och tillförlitligt inom områden som fysik, matematik och programmering.

”Vi rekommenderar att använda o3-pro för svåra frågor där tillförlitlighet är viktigare än hastighet, och att vänta några minuter är en värdefull avvägning”, uppgav företaget. I delade testrecensioner uppnådde o3-pro överlägsna resultat jämfört med o3- och o1-pro-versionerna.

I en kommentar till den nya modellen sa Ben Hylak, en tidigare Apple-anställd och medgrundare av AI-utvecklingsföretaget Raindrop, att den är mycket smartare. Han sammanställde en historik över alla tidigare möten på sitt företag och bad sedan o3-pro att skapa en plan.

Resultaten var ganska imponerande, specifika och tydligt analyserade – precis som han alltid hade hoppats att storskalig språkmodellering (LLM) skulle kunna uppnå. Planen inkluderade målvärden, tidslinjer, prioriteringar och strikta riktlinjer för vad som skulle elimineras helt. ”Det var så specifikt och välgrundat att jag var tvungen att ompröva mitt företags framtid”, skrev han.

ny resonemangsmodell bild 1

Resultaten från o3 pro (vänster) är mer specifika och tillförlitliga. Foto: Ben Hylak/X.

O3-pro kostar 20 dollar per miljon investerade tokens och 80 dollar per miljon exporterade tokens när det används via API:et. Detta beror på AI:ns förmåga att memorera och bearbeta data. En miljon investerade tokens motsvarar cirka 750 000 ord, vilket är ännu längre än boken *War and Peace* , som The Verge jämför.

OpenAI uppger att experter konsekvent rankar o3 pro högre än o3 i varje testad kategori. Recensenter ger också o3 pro högre betyg för konsekvens inom flera kriterier såsom tydlighet, uppföljbarhet och noggrannhet, särskilt inom viktiga områden som vetenskap, utbildning , programmering, affärsverksamhet och skrivstöd.

På AIME 2024, ett test som utvärderar modellens matematiska förmågor, fick o3 pro högre poäng än till och med Gemini 2.5 Pro, Googles främsta AI. Dessutom överträffade modellen Anthropics Claude 4 Opus i GPQA Diamond, ett vetenskapligt kunskapstest på doktorandnivå.

o3 pro integrerar också verktyg som gör det möjligt att söka på webben, analysera filer, använda Python för beräkning och programmering och anpassa svar genom att utnyttja minne. Ben Hylak kommenterade denna aspekt och noterade att verktyget tydligt visar sin förmåga att känna igen sin omgivning, veta när man ska fråga om omvärlden (istället för att låtsas veta) och välja rätt verktyg för varje uppgift.

Modellens största nackdel ligger dock i dess svarstid, som är ännu långsammare än o1 pro. YouTubern Bijan Bowen håller med om detta. "Även om modellens svar är ganska tydligt, inom bara några få beskrivande meningar, är svarstiden ganska lång", sa han. Speciellt i fall med otillräcklig extern data tenderar modellen att övertänka, tillade Ben Hylak.

O3-pro har också några andra begränsningar, såsom oförmågan att skapa bilder, samt stöd för Canvas-funktionen. Den tillfälliga chattfunktionen med den här modellen i ChatGPT är för närvarande inaktiverad medan OpenAI åtgärdar ett "tekniskt problem".

Hylak menar dock att detta inte är en modell för användarvänlig chatt som Claude 3.5 Sonnet eller ChatGPT 4o. Nate B. Jones, produktchef på Rockerbox, rekommenderar att o3 pro bör användas för utmanande uppgifter som kräver 15–20 minuters tanketid.

Källa: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html