Nowy model wnioskowania ChatGPT

O3 Pro wyróżnia się możliwością obsługi złożonych żądań. Zdjęcie: OpenAI.

OpenAI wprowadziło na rynek pakiet O3 Pro w cenie 200 dolarów miesięcznie z Teamem za pośrednictwem API. To ulepszona wersja O3, która została wprowadzona kilka miesięcy temu. O3 Pro jest reklamowane przez firmę jako najpotężniejsza wersja dostępna obecnie na rynku.

Wszystkie wersje z dodanym słowem „pro” kojarzone są z możliwością odpowiadania na trudniejsze i dłuższe pytania. W przeciwieństwie do typowych wersji sztucznej inteligencji, model rozumowania przetwarza problemy krok po kroku, co pozwala mu działać stabilniej i niezawodniej w dziedzinach takich jak fizyka, matematyka i programowanie.

„Zalecamy korzystanie z o3-pro w przypadku trudnych pytań, w których niezawodność jest ważniejsza niż szybkość, a odczekanie kilku minut to opłacalny kompromis” – stwierdziła firma. We wspólnych testach, o3-pro uzyskał lepsze wyniki w porównaniu z wersjami o3 i o1-pro.

Komentując ten nowy model, Ben Hylak, były pracownik Apple i współzałożyciel firmy Raindrop, zajmującej się rozwojem sztucznej inteligencji, powiedział, że jest on o wiele inteligentniejszy. Zebrał historię wszystkich poprzednich spotkań w swojej firmie, a następnie poprosił o3-pro o stworzenie planu.

Wyniki były imponujące, konkretne i jasno przeanalizowane – dokładnie takie, jakich zawsze oczekiwał od modelowania języka na dużą skalę (LLM). Plan obejmował docelowe wskaźniki, harmonogramy, priorytety i ścisłe wytyczne dotyczące tego, co całkowicie wyeliminować. „Był tak konkretny i uzasadniony, że musiałem przemyśleć przyszłość mojej firmy” – napisał.

nowy model rozumowania obraz 1

Wyniki uzyskane z o3 pro (po lewej) są bardziej szczegółowe i wiarygodne. Zdjęcie: Ben Hylak/X.

O3-pro kosztuje 20 dolarów za milion zainwestowanych tokenów i 80 dolarów za milion eksportowanych tokenów, gdy jest używany za pośrednictwem API. Wynika to ze zdolności sztucznej inteligencji do zapamiętywania i przetwarzania danych. Milion zainwestowanych tokenów odpowiada około 750 000 słów, czyli więcej niż książka „Wojna i pokój” , jak porównuje The Verge .

OpenAI twierdzi, że eksperci konsekwentnie oceniają O3 Pro wyżej niż O3 w każdej testowanej kategorii. Recenzenci przyznają O3 Pro wyższe oceny za spójność w kilku kryteriach, takich jak przejrzystość, spójność i dokładność, szczególnie w kluczowych obszarach, takich jak nauka, edukacja , programowanie, biznes i wsparcie w pisaniu.

W teście AIME 2024, oceniającym możliwości matematyczne modelu, o3 pro uzyskał lepszy wynik niż Gemini 2.5 Pro, najlepszy model sztucznej inteligencji Google. Ponadto model ten przewyższył Claude 4 Opus firmy Anthropic w teście GPQA Diamond, teście wiedzy naukowej na poziomie doktorskim.

O3 Pro integruje również narzędzia, które pozwalają mu przeszukiwać sieć, analizować pliki, używać Pythona do obliczeń i programowania oraz personalizować odpowiedzi poprzez wykorzystanie pamięci. Komentując ten aspekt, Ben Hylak zauważył, że narzędzie wyraźnie demonstruje swoją zdolność rozpoznawania otoczenia, wiedząc, kiedy pytać o świat zewnętrzny (zamiast udawać, że wie) i dobierając odpowiednie narzędzie do każdego zadania.

Jednak największą wadą modelu jest jego czas reakcji, który jest jeszcze wolniejszy niż w przypadku o1 pro. YouTuber Bijan Bowen zgadza się z tym stwierdzeniem. „Chociaż reakcja modelu jest dość klarowna, wyrażona w zaledwie kilku zdaniach opisowych, czas reakcji jest dość długi” – powiedział. Ben Hylak dodał, że model ma tendencję do nadmiernego analizowania danych, zwłaszcza w przypadku niewystarczającej ilości danych zewnętrznych.

O3-pro ma również pewne ograniczenia, takie jak brak możliwości tworzenia obrazów oraz obsługa funkcji Canvas. Tymczasowa funkcja czatu z tym modelem w ChatGPT jest obecnie wyłączona, a OpenAI naprawia „problem techniczny”.

Hylak twierdzi jednak, że nie jest to model przyjazny dla użytkownika, taki jak Claude 3.5 Sonnet czy ChatGPT 4o. Nate B. Jones, szef produktu w Rockerbox, radzi, aby o3 pro używać do zadań wymagających 15-20 minut namysłu.

Źródło: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html