Nový inferenční model ChatGPT

O3 Pro vyniká svou schopností zpracovávat složité požadavky. Obrázek: OpenAI.

Společnost OpenAI uvedla na trh O3 Pro v balíčku Pro za 200 dolarů měsíčně s podporou Team přes API. Vylepšená verze O3, která byla představena před několika měsíci, je společností propagována jako nejvýkonnější verze, která je v současnosti k dispozici.

Všechny verze s přidaným slovem „pro“ jsou spojeny se schopností odpovídat na obtížnější a delší otázky. Na rozdíl od typických verzí s umělou inteligencí zpracovává model uvažování problémy krok za krokem, což mu umožňuje stabilnější a spolehlivější fungování v oblastech, jako je fyzika, matematika a programování.

„Pro složité otázky, kde je spolehlivost důležitější než rychlost, doporučujeme používat o3-pro a čekat několik minut je užitečný kompromis,“ uvedla společnost. Ve sdílených testovacích recenzích dosáhl o3-pro lepších výsledků ve srovnání s verzemi o3 a o1-pro.

Ben Hylak, bývalý zaměstnanec společnosti Apple a spoluzakladatel společnosti Raindrop, která se zabývá vývojem umělé inteligence, v komentáři k tomuto novému modelu uvedl, že je mnohem chytřejší. Sestavil historii všech předchozích schůzek ve své firmě a poté požádal o3-pro o vytvoření plánu.

Výsledky byly poměrně působivé, specifické a jasně analyzované – přesně jak vždy doufal, že by se dalo dosáhnout pomocí rozsáhlého jazykového modelování (LLM). Plán zahrnoval cílové metriky, časové harmonogramy, priority a striktní pokyny, co zcela eliminovat. „Bylo to tak specifické a dobře podložené, že jsem musel přehodnotit budoucnost své společnosti,“ napsal.

nový model uvažování, obrázek 1

Výsledky získané z o3 pro (vlevo) jsou specifičtější a spolehlivější. Foto: Ben Hylak/X.

O3-pro stojí 20 dolarů za milion investovaných tokenů a 80 dolarů za milion exportovaných tokenů při použití přes API. To je dáno schopností umělé inteligence zapamatovat si a zpracovávat data. Jeden milion investovaných tokenů odpovídá přibližně 750 000 slovům, což je dokonce delší než kniha *Válka a mír* , jak srovnává The Verge .

OpenAI uvádí, že experti v každé testované kategorii konzistentně hodnotí O3 Pro výše než O3. Recenzenti také udělují O3 Pro vyšší hodnocení za konzistenci v několika kritériích, jako je srozumitelnost, sledovatelnost a přesnost, zejména v klíčových oblastech, jako je věda, vzdělávání , programování, obchod a podpora psaní.

V testu AIME 2024, který hodnotil matematické schopnosti modelu, dosáhl o3 pro dokonce vyššího skóre než Gemini 2.5 Pro, špičková umělá inteligence od Googlu. Model navíc překonal Claude 4 Opus od Anthropic v testu GPQA Diamond, což je test vědeckých znalostí na doktorské úrovni.

o3 pro také integruje nástroje, které mu umožňují vyhledávat na webu, analyzovat soubory, používat Python pro výpočty a programování a personalizovat odpovědi využitím paměti. Ben Hylak k tomuto aspektu poznamenal, že nástroj jasně prokazuje svou schopnost rozpoznávat své okolí, vědět, kdy se zeptat na vnější svět (místo předstírání, že to ví), a vybrat pro každý úkol ten správný nástroj.

Největší nevýhodou modelu je však jeho doba odezvy, která je ještě pomalejší než u o1 pro. S tím souhlasí i YouTuber Bijan Bowen. „Ačkoli je odezva modelu celkem jasná, v rámci několika popisných vět je doba odezvy poměrně dlouhá,“ řekl. Zejména v případech s nedostatkem externích dat má model tendenci přemýšlet, dodal Ben Hylak.

O3-pro má také některá další omezení, jako je nemožnost vytvářet obrázky a také podpora funkce Canvas. Dočasná funkce chatu s tímto modelem v ChatGPT je momentálně nedostupná, protože OpenAI opravuje „technický problém“.

Hylak však tvrdí, že se nejedná o model pro uživatelsky přívětivý chat jako Claude 3.5 Sonnet nebo ChatGPT 4o. Nate B. Jones, vedoucí produktu ve společnosti Rockerbox, radí, že o3 pro by se měl používat pro náročné úkoly vyžadující 15–20 minut přemýšlení.

Zdroj: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html