Компания DeepSeek сосредоточена на исследованиях и разработке новых моделей, а не на частом появлении в СМИ. Фото: SCMP . |
В сотрудничестве с исследователями из Университета Цинхуа компания DeepSeek представила новый метод повышения точности вывода больших языковых моделей (LLM). Метод, опубликованный в научной статье вечером 4 апреля, помогает LLM получать более качественные и быстрые результаты для распространенных запросов.
Эта техника сочетает в себе два ранее успешных метода DeepSeek. Один из них — генеративное моделирование вознаграждения (GRM), которое позволяет модели ИИ самостоятельно оценивать и корректировать свои ответы на основе предыдущих результатов, а другой — самонастраивающаяся критика.
Оба метода основаны на аспекте «самообучения» ИИ, что снижает зависимость от прямой обратной связи или указаний человека, но направлены на получение результатов, более близких к ожиданиям человека.
По словам исследователей, несмотря на свою новизну, DeepSeek-GRM демонстрирует выдающиеся результаты и конкурирует с наиболее известными и эффективными моделями искусственного интеллекта, доступными в настоящее время. DeepSeek планирует сделать модели GRM открытыми для публичного доступа, но конкретные сроки пока не указаны.
После того, как DeepSeek произвела фурор во всем мире благодаря своей платформенной модели V3 и модели вывода R1, компания опубликовала эту научную статью в онлайн-архиве научных публикаций arXiv, что вызвало любопытство относительно дальнейших шагов компании.
Агентство Reuters прогнозирует, что DeepSeek-R2, преемник R1, может быть выпущен в апреле, учитывая сохраняющуюся популярность его предшественника. DeepSeek-R1 ранее произвел фурор в мире технологий благодаря превосходной производительности по отношению к цене, что сделало его конкурентоспособным по сравнению с ведущими современными моделями.
Компания DeepSeek хранит молчание по поводу этих слухов. Однако, по данным местных источников, сотрудник службы поддержки DeepSeek опроверг эту информацию в групповом чате с корпоративными клиентами.
Компания DeepSeek, основанная в Ханчжоу в 2023 году предпринимателем Лян Вэньфэном, за последние несколько месяцев быстро привлекла к себе внимание всего мира. Но вместо того, чтобы извлекать выгоду из своей популярности, компания сосредоточила свои ресурсы на исследованиях и разработках.
Ранее DeepSeek обновила свою модель V3, выпустив версию DeepSeek-V3-0324. Согласно объявлению, это обновление включает в себя улучшенные возможности логического мышления, оптимизацию для разработки пользовательского интерфейса веб-сайта и улучшенные навыки письма на китайском языке.
В феврале стартап также открыл исходный код пяти репозиториев, подтвердив свою приверженность принципу «прогресса с полной прозрачностью». В том же месяце компания объявила о техническом исследовании «встроенного разреженного внимания», которое помогает улучшить производительность LLM-систем при обработке огромных объемов данных.
DeepSeek рассматривается как символ динамизма китайской индустрии искусственного интеллекта в то время, когда США пытаются сдержать технологическое развитие страны.
Источник: https://znews.vn/deepseek-gay-to-mo-post1543900.html






Комментарий (0)