Нова модель виведення ChatGPT

o3 pro вирізняється своєю здатністю обробляти складні запити. Зображення: OpenAI.

OpenAI випустила o3 pro у пакеті Pro за ціною 200 доларів США на місяць з Team via API. O3 Pro – це оновлена версія o3, представлена кілька місяців тому, яку компанія рекламує як найпотужнішу версію з доступних на даний момент.

Усі версії з доданим словом «про» асоціюються зі здатністю відповідати на складніші та довші запитання. На відміну від типових версій ШІ, модель міркування обробляє проблеми крок за кроком, що дозволяє їй працювати стабільніше та надійніше в таких галузях, як фізика, математика та програмування.

«Ми рекомендуємо використовувати o3-pro для складних питань, де надійність важливіша за швидкість, і кілька хвилин очікування є гідним компромісом», – заявила компанія. У спільних тестових оглядах o3-pro досягла кращих результатів порівняно з версіями o3 та o1-pro.

Коментуючи цю нову модель, Бен Хайлак, колишній співробітник Apple та співзасновник компанії з розробки штучного інтелекту Raindrop, сказав, що вона набагато розумніша. Він склав історію всіх попередніх зустрічей у своїй компанії, а потім попросив o3-pro створити план.

Результати були досить вражаючими, конкретними та чітко проаналізованими — саме так, як він завжди сподівався досягти за допомогою масштабного мовного моделювання (LLM). План включав цільові показники, терміни, пріоритети та чіткі вказівки щодо того, що повністю виключити. «Він був настільки конкретним та обґрунтованим, що мені довелося переосмислити майбутнє моєї компанії», — писав він.

нове зображення моделі міркування 1

Результати, отримані за допомогою o3 pro (ліворуч), є більш конкретними та надійними. Фото: Бен Хайлак/X.

O3-pro коштує 20 доларів за кожен мільйон інвестованих токенів та 80 доларів за кожен мільйон експортованих токенів при використанні через API. Це пов'язано зі здатністю штучного інтелекту запам'ятовувати та обробляти дані. Один мільйон інвестованих токенів еквівалентний приблизно 750 000 слів, що навіть довше, ніж книга *Війна і мир* , як порівнює The Verge .

OpenAI стверджує, що експерти постійно оцінюють o3 pro вище, ніж o3 у кожній протестованій категорії. Рецензенти також дають o3 pro вищі оцінки за узгодженість у кількох критеріях, таких як зрозумілість, зручність для відстеження та точність, особливо в ключових сферах, таких як наука, освіта , програмування, бізнес та підтримка письма.

У тесті AIME 2024, що оцінює математичні можливості моделі, o3 pro набрала вищий бал навіть за Gemini 2.5 Pro, найкращий штучний інтелект Google. Крім того, модель також перевершила Claude 4 Opus від Anthropic у GPQA Diamond, тесті на наукові знання докторського рівня.

o3 pro також інтегрує інструменти, які дозволяють йому шукати в Інтернеті, аналізувати файли, використовувати Python для обчислень та програмування, а також персоналізувати відповіді, використовуючи пам'ять. Коментуючи цей аспект, Бен Хайлак зазначив, що інструмент чітко демонструє свою здатність розпізнавати оточення, знаючи, коли запитувати про зовнішній світ (замість того, щоб вдавати, що знає), та вибираючи правильний інструмент для кожного завдання.

Однак найбільшим недоліком моделі є час відгуку, який навіть повільніший, ніж у o1 pro. YouTuber Bijan Bowen погоджується з цим. «Хоча відповідь моделі досить чітка, всього в кількох описових реченнях, час відгуку досить довгий», – сказав він. Бен Хайлак додав, що модель схильна до надмірного обдумування, особливо у випадках недостатньої кількості зовнішніх даних.

O3-pro також має деякі інші обмеження, такі як неможливість створення зображень, а також підтримка функції Canvas. Тимчасова функція чату з цією моделлю в ChatGPT наразі вимкнена, поки OpenAI виправляє «технічну проблему».

Однак, Хайлак стверджує, що це не модель для зручного чату, як Claude 3.5 Sonnet або ChatGPT 4o. Нейт Б. Джонс, керівник відділу продуктів Rockerbox, радить використовувати o3 pro для складних завдань, що потребують 15-20 хвилин на роздуми.

Джерело: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html