o3 pro выделяется своей способностью обрабатывать сложные запросы. Фото: OpenAI. |
Компания OpenAI выпустила o3 pro в составе пакета Pro за 200 долларов в месяц и возможность работы в команде через API. O3 pro — это обновлённая версия o3, представленного несколько месяцев назад. Компания считает o3 pro самой мощной на сегодняшний день.
Все версии с пометкой «pro» будут ассоциированы с возможностью отвечать на более сложные и длинные вопросы. В отличие от обычных версий ИИ, модели вывода решают задачи поэтапно, что позволяет им работать более надёжно и согласованно в таких областях, как физика, математика и программирование.
«Мы рекомендуем o3-pro для решения сложных задач, где надёжность важнее скорости, и несколько минут ожидания оправдывают компромисс», — заявила компания. В ходе совместных тестовых обзоров o3-pro превзошёл версии o3 и o1-pro.
Бен Хилак, бывший сотрудник Apple и соучредитель стартапа Raindrop, специализирующегося на искусственном интеллекте, отметил, что новая модель гораздо умнее. Он собрал историю всех предыдущих встреч в своей компании, а затем попросил o3-pro разработать план.
Результаты оказались впечатляющими: они были настолько конкретными и аналитическими, насколько он надеялся, что модель большого языка (LLM) будет такой же. План включал целевые показатели, сроки, приоритеты и строгие указания о том, что следует полностью исключить. «Он был настолько конкретным и обоснованным, что мне пришлось переосмыслить будущее моей компании», — пишет он.
Результаты o3 pro (слева) более конкретны и обоснованы. Фото: Бен Хилак/X. |
Стоимость O3-pro составляет 20 долларов за миллион входных токенов и 80 долларов за миллион выходных токенов при использовании через API. Это отражает способность ИИ запоминать и обрабатывать данные. Один миллион входных токенов эквивалентен примерно 750 000 слов, что длиннее книги «Война и мир» ( The Verge) .
OpenAI сообщает, что эксперты неизменно давали o3 pro более высокую оценку, чем o3, во всех протестированных категориях. Оценщики также дали o3 pro более высокую оценку за согласованность по ряду критериев, включая ясность, простоту выполнения инструкций и точность, особенно в таких ключевых областях, как наука, образование , программирование, бизнес и поддержка написания текстов.
На AIME 2024, тесте, оценивающем математические способности модели, o3 pro показал более высокие результаты, чем Gemini 2.5 Pro, флагманский ИИ-инструмент Google. Кроме того, модель превзошла Claude 4 Opus от Anthropic на GPQA Diamond, тесте на научные знания докторского уровня.
o3 pro также оснащен встроенными инструментами, которые позволяют ему осуществлять поиск в интернете, анализировать файлы, использовать Python для вычислений и программирования, а также персонализировать ответы, используя память. Комментируя этот аспект, Бен Хилак отметил, что инструмент наглядно демонстрирует свою способность распознавать окружающую обстановку, определять, когда нужно спрашивать об окружающем мире (вместо того, чтобы делать вид, что знаешь), и выбирать подходящий инструмент для каждой задачи.
Однако самый большой недостаток модели — время отклика, которое даже меньше, чем у o1 pro. YouTube-блогер Биджан Боуэн согласен с этим. «Хотя ответ модели довольно ясен, он состоит всего из нескольких предложений, время отклика довольно велико», — сказал он. Бен Хилак добавил, что, особенно в случаях, когда внешних данных недостаточно, модель склонна мыслить хаотично.
У O3-pro есть и другие ограничения, такие как невозможность создания изображений и поддержка функции Canvas. Временная функция чата ChatGPT с этой моделью в настоящее время отключена, пока OpenAI устраняет «техническую проблему».
Однако г-н Хилак отметил, что это не модель для общения пользователей, как Claude 3.5 Sonnet или ChatGPT 4o. Нейт Б. Джонс, руководитель отдела продуктов Rockerbox, посоветовал использовать o3 pro для сложных задач, требующих 15–20 минут размышлений.
Источник: https://znews.vn/mo-hinh-suy-luan-moi-cua-chatgpt-post1560084.html
Комментарий (0)