Новая модель вывода ChatGPT

Устройство o3 pro выделяется своей способностью обрабатывать сложные запросы. Изображение: OpenAI.

Компания OpenAI выпустила o3 Pro в пакете Pro по цене 200 долларов в месяц с возможностью подключения к Team через API. Обновленная версия o3, представленная несколько месяцев назад, o3 Pro позиционируется компанией как самая мощная из доступных на данный момент версий.

Все версии с добавленным словом «про» связаны со способностью отвечать на более сложные и объемные вопросы. В отличие от типичных версий ИИ, модель рассуждений обрабатывает задачи пошагово, что позволяет ей работать более стабильно и надежно в таких областях, как физика, математика и программирование.

«Мы рекомендуем использовать o3-pro для сложных задач, где надежность важнее скорости, и ожидание нескольких минут оправдано», — заявила компания. В ходе совместных тестовых обзоров o3-pro показал лучшие результаты по сравнению с версиями o3 и o1-pro.

Комментируя эту новую модель, Бен Хайлак, бывший сотрудник Apple и соучредитель компании Raindrop, занимающейся разработкой искусственного интеллекта, сказал, что она намного умнее. Он собрал историю всех предыдущих встреч в своей компании, а затем попросил компанию o3-pro составить план.

Результаты оказались весьма впечатляющими, конкретными и четко проанализированными — именно такими, какими он всегда надеялся достичь с помощью крупномасштабного языкового моделирования (LLM). План включал целевые показатели, сроки, приоритеты и строгие указания относительно того, что следует полностью исключить. «Он был настолько конкретным и обоснованным, что мне пришлось переосмыслить будущее моей компании», — написал он.

новая модель рассуждений изображение 1

Результаты, полученные с помощью o3 pro (слева), являются более точными и надежными. Фото: Бен Хайлак/X.

Стоимость O3-pro составляет 20 долларов за миллион инвестированных токенов и 80 долларов за миллион экспортированных токенов при использовании через API. Это связано со способностью ИИ запоминать и обрабатывать данные. Один миллион инвестированных токенов эквивалентен примерно 750 000 словам, что даже длиннее, чем книга «Война и мир» , как сравнивает The Verge .

OpenAI заявляет, что эксперты неизменно оценивают o3 pro выше, чем o3, по всем протестированным категориям. Рецензенты также дают o3 pro более высокие оценки за согласованность по нескольким критериям, таким как ясность, понятность и точность, особенно в ключевых областях, таких как наука, образование , программирование, бизнес и поддержка написания текстов.

В тесте AIME 2024, оценивающем математические возможности модели, o3 pro показала результаты выше, чем даже Gemini 2.5 Pro, лучшая модель искусственного интеллекта от Google. Кроме того, модель также превзошла Claude 4 Opus от Anthropic в тесте GPQA Diamond, представляющем собой проверку научных знаний на уровне доктора наук.

O3 Pro также включает в себя инструменты, позволяющие осуществлять поиск в интернете, анализировать файлы, использовать Python для вычислений и программирования, а также персонализировать ответы за счет использования памяти. Комментируя этот аспект, Бен Хайлак отметил, что инструмент наглядно демонстрирует свою способность распознавать окружающую среду, зная, когда следует задавать вопросы о внешнем мире (вместо того, чтобы делать вид, что знает), и выбирая подходящий инструмент для каждой задачи.

Однако самым большим недостатком модели является время отклика, которое даже медленнее, чем у o1 pro. Ютубер Биджан Боуэн согласен с этим. «Хотя ответ модели довольно понятен, даже в нескольких описательных предложениях время отклика довольно велико», — сказал он. Особенно в случаях с недостаточным количеством внешних данных модель склонна к излишнему анализу, добавил Бен Хайлак.

У O3-pro также есть ряд других ограничений, таких как невозможность создания изображений, а также поддержка функции Canvas. Временная функция чата в ChatGPT для этой модели в настоящее время отключена, пока OpenAI устраняет «техническую проблему».

Однако Хайлак утверждает, что это не модель для удобного в использовании чата, подобного Claude 3.5 Sonnet или ChatGPT 4o. Нейт Б. Джонс, руководитель отдела продуктов Rockerbox, советует использовать o3 pro для сложных задач, требующих 15-20 минут на обдумывание.

Источник: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html