Новое исследование раскрывает секрет успеха DeepSeek

По данным DeepSeek, модель искусственного интеллекта R1 не обучалась с использованием данных модели OpenAI, хотя компания признала, что базовая модель обучалась на веб-данных, которые могут включать контент, сгенерированный ИИ.

VietnamPlus•18/09/2025

Модель искусственного интеллекта R1 китайского стартапа DeepSeek, запуск которой в январе потряс американский фондовый рынок, была опубликована в первом рецензируемом исследовании, демонстрирующем, как компания разработала мощную степень магистра права всего за 300 000 долларов.

R1 разработан для решения таких задач, требующих рассуждений, как математика и программирование, что делает его недорогим конкурентом инструментам, разработанным американскими технологическими гигантами.

Это модель «открытого веса», которую можно загрузить бесплатно. На данный момент она является самой популярной моделью на платформе Hugging Face, ее скачали более 10,9 миллионов раз.

Исследование Nature, являющееся обновленной версией январской рукописи, впервые показало, что обучение R1 обошлось всего в 294 000 долларов США, в дополнение к примерно 6 миллионам долларов США, потраченным на создание базовой модели.

Эта цифра намного ниже десятков миллионов долларов, которые, как утверждается, потратили конкуренты.

DeepSeek заявил, что R1 обучался преимущественно с использованием чипов Nvidia H800, экспорт которых в Китай запрещен США с 2023 года.

Прорывом R1 стало использование «чистого обучения с подкреплением», когда модель обучается методом проб и ошибок и вознаграждается за правильные ответы, а не на примерах, выбранных людьми. R1 также оценивает свои собственные усилия, используя внутренние оценки, метод, называемый «оптимизацией относительной групповой политики», что способствует повышению производительности.

«Строгий процесс экспертной оценки помогает подтвердить ценность и надёжность модели», — говорит исследователь Хуан Сан (Университет штата Огайо). «Другим компаниям стоит поступить так же».

Льюис Танстолл, инженер по машинному обучению в Hugging Face, сказал, что это важный прецедент, поскольку прозрачность в разработке ИИ помогает точнее оценивать риски.

DeepSeek утверждает, что R1 не обучался с использованием данных моделей OpenAI, хотя признает, что базовая модель обучалась на веб-данных, которые могут включать контент, сгенерированный ИИ.

Эксперты утверждают, что, хотя это и трудно проверить абсолютно, имеющиеся на сегодняшний день данные свидетельствуют о том, что чистого улучшения достаточно для достижения высокой производительности.

В тесте ScienceAgentBench R1 не занял лидирующие позиции по точности, но показал хороший баланс между эффективностью и стоимостью. Теперь исследователи планируют применить метод DeepSeek для улучшения способности к рассуждению существующих LLM-программистов, а также распространить его на области, выходящие за рамки математики и программирования.

По словам г-на Танстолла, R1 «начал революцию» в развитии искусственного интеллекта./.

(TTXVN/Вьетнам+)

Источник: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp