o3 pro выделяется своей способностью обрабатывать сложные запросы. Фото: OpenAI. |
OpenAI запустила o3 pro в своем пакете Pro за $200/месяц и Team via API. Обновленная версия o3, представленная несколько месяцев назад, o3 pro, по мнению компании, является самой мощной из всех.
Все версии с тегом «pro» будут ассоциироваться с возможностью отвечать на более сложные и длинные вопросы. В отличие от обычных версий ИИ, модели вывода решают проблемы шаг за шагом, что позволяет им работать более надежно и последовательно в таких областях, как физика, математика и программирование.
«Мы рекомендуем o3-pro для сложных вопросов, где надежность важнее скорости, и ожидание в несколько минут стоит компромисса», — заявила компания. В общих тестовых обзорах o3-pro превзошел версии o3 и o1-pro.
Бен Хилак, бывший сотрудник Apple и соучредитель стартапа AI Raindrop, сказал, что новая модель намного умнее. Он собрал историю всех предыдущих встреч в своей компании, а затем попросил o3-pro создать план.
Результаты были впечатляющими, такими же конкретными и аналитическими, какими он надеялся, будет большая языковая модель (LLM). План включал целевые метрики, сроки, приоритеты и строгие инструкции о том, что следует полностью исключить. «Это было настолько конкретным и обоснованным, что мне пришлось переосмыслить будущее моей компании», — пишет он.
Результаты o3 pro (слева) более конкретны и обоснованы. Фото: Ben Hylak/X. |
O3-pro стоит $20 за 1 миллион входных токенов и $80 за 1 миллион выходных токенов при использовании через API. Это способность ИИ запоминать и обрабатывать данные. Один миллион входных токенов эквивалентен примерно 750 000 слов, что длиннее, чем сравнивали книгу «Война и мир» и The Verge .
OpenAI пишет, что эксперты постоянно давали o3 pro более высокую оценку, чем o3 в каждой протестированной категории. Оценщики также дали o3 pro более высокую оценку за согласованность по ряду критериев, включая ясность, простоту выполнения инструкций и точность, особенно в таких ключевых областях, как наука, образование , программирование, бизнес и поддержка письма.
На AIME 2024, тесте, который оценивает математические способности модели, o3 pro набрал больше баллов, чем Gemini 2.5 Pro, флагманский ИИ Google. Кроме того, модель также превзошла Claude 4 Opus от Anthropic на GPQA Diamond, тесте научных знаний докторского уровня.
o3 pro также поставляется со встроенными инструментами, которые позволяют ему искать в Интернете, анализировать файлы, использовать Python для вычислений и программирования и персонализировать ответы, используя память. Комментируя этот аспект, Бен Хилак сказал, что инструмент наглядно демонстрирует свою способность распознавать свое окружение, когда спрашивать о внешнем мире (вместо того, чтобы притворяться, что знаешь), и выбирать правильный инструмент для каждой задачи.
Однако самым большим недостатком модели является время отклика, которое даже медленнее, чем у o1 pro. YouTuber Биджан Боуэн соглашается. «Хотя ответ модели довольно ясен, всего в нескольких предложениях описания, время отклика довольно долгое», — сказал он. Особенно в случаях, когда внешних данных недостаточно, модель имеет тенденцию думать случайным образом, добавил Бен Хилак.
O3-pro также имеет некоторые другие ограничения, такие как невозможность генерировать изображения, а также поддержка функции Canvas. Временная функция чата ChatGPT с этой моделью в настоящее время отключена, пока OpenAI устраняет «техническую проблему».
Однако г-н Хилак сказал, что это не модель для пользователей, чтобы общаться, как Claude 3.5 Sonnet или ChatGPT 4o. Совет от Нейта Б. Джонса, руководителя отдела продуктов в Rockerbox, сказал, что o3 pro следует использовать для сложных задач, требующих 15-20 минут размышлений.
Источник: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html
Комментарий (0)