5 августа компания OpenAI впервые с момента запуска GPT-2 в 2019 году анонсировала две открытые взвешенные языковые модели.
Модель искусственного интеллекта считается открытой, если ее параметры, т. е. факторы, помогающие улучшить выходные данные и прогнозы в процессе обучения, общедоступны.
Открытые модели взвешивания могут обеспечить прозрачность и контроль, но они отличаются от моделей с открытым исходным кодом, которые делают весь исходный код доступным для использования и изменения любым лицом.
OpenAI утверждает, что эти текстовые модели, называемые gpt-oss-120b и gpt-oss-20b, предназначены для предоставления разработчикам, исследователям и компаниям недорогих вариантов, которые легко использовать и настраивать.
Обе новые модели OpenAI способны решать сложные задачи вывода, использования инструментов и нейронной обработки. Они разработаны для работы на любых устройствах: от потребительского оборудования до облачных платформ и локальных приложений.
OpenAI утверждает, что пользователи могут запустить gpt-oss-20b на ноутбуке и использовать его в качестве персонального помощника, который может искать в файлах и писать.
Компания сотрудничает с Nvidia, Advanced Micro Devices (AMD), Cerebras и Groq, чтобы гарантировать, что эти модели будут хорошо работать на различных чипах.
Выпуск OpenAI своих открытых весовых моделей был долгожданным, отчасти потому, что компания неоднократно откладывала запуск, поскольку ей требовалось больше времени для проведения дополнительных испытаний на безопасность и проверки зон повышенного риска.
Компания OpenAI сообщила 5 августа, что провела масштабное обучение и тестирование безопасности своих открытых весовых моделей. На этапе предварительного обучения компания отфильтровала вредоносные химические, биологические, радиологические и ядерные данные и смоделировала, как злоумышленники могут попытаться настроить модели в вредоносных целях.
Компания OpenAI также заявила, что работала с тремя независимыми группами экспертов, чтобы получить обратную связь по своей оценке этого вредоносного процесса настройки.
В последние годы несколько других технологических компаний, таких как Meta, поддерживаемая Microsoft Mistral AI и китайский стартап DeepSeek, также выпустили открытые модели взвешивания./.
Источник: https://www.vietnamplus.vn/openai-lan-dau-phat-hanh-mo-hinh-ai-trong-so-mo-ke-tu-nam-2019-post1054037.vnp
Комментарий (0)