Нове дослідження розкриває секрет успіху DeepSeek

За даними DeepSeek, модель штучного інтелекту R1 не навчалася з використанням даних з моделі OpenAI, хоча компанія визнала, що базова модель навчалася на веб-даних, які можуть включати контент, згенерований штучним інтелектом.

VietnamPlus•17/09/2025

Модель штучного інтелекту R1 китайського стартапу DeepSeek, яка шокувала фондовий ринок США під час свого запуску в січні, була опублікована в першому рецензованому дослідженні, яке показує, як компанія розробила потужну LLM всього за 300 000 доларів.

R1 розроблений для досягнення успіху в таких завданнях мислення, як математика та програмування, що робить його недорогим конкурентом інструментам, розробленим американськими технологічними гігантами.

Це модель «відкритої ваги», яку можна завантажити безкоштовно, і наразі вона є найпопулярнішою моделлю на платформі Hugging Face, маючи понад 10,9 мільйона завантажень.

У дослідженні Nature, оновленій версії січневого рукопису, вперше було виявлено, що навчання R1 коштувало лише 294 000 доларів, на додаток до близько 6 мільйонів доларів, витрачених на створення базової моделі.

Ця цифра значно нижча за десятки мільйонів доларів, які, як кажуть, витратили конкуренти.

DeepSeek повідомив, що R1 навчався переважно з використанням чіпів Nvidia H800, експорт яких до Китаю США заборонили з 2023 року.

Проривом R1 стало використання «чистого навчання з підкріпленням», де модель навчається методом спроб і помилок і винагороджується за правильні відповіді, а не навчається на прикладах, обраних людьми. Він також оцінює власні зусилля за допомогою внутрішніх оцінок – методу, який називається «відносна оптимізація групової політики», що допомагає підвищити продуктивність.

«Ретельний процес експертної оцінки допомагає підтвердити цінність та надійність моделі», — каже дослідник Хуан Сун (Університет штату Огайо). «Інші фірми повинні зробити те саме».

Льюїс Танстолл, інженер з машинного навчання в Hugging Face, сказав, що це важливий прецедент, оскільки прозорість у розробці штучного інтелекту допомагає точніше оцінювати ризики.

DeepSeek стверджує, що R1 не навчався з використанням даних з моделей OpenAI, хоча й визнає, що базова модель була навчена на веб-даних, які можуть включати контент, згенерований штучним інтелектом.

Експерти кажуть, що хоча важко точно це перевірити, сучасні дані свідчать про те, що чистого покращення достатньо для досягнення високої продуктивності.

У тесті ScienceAgentBench R1 не показав найвищих результатів за точністю, але досяг гарного балансу між ефективністю та вартістю. Зараз дослідники прагнуть застосувати метод DeepSeek для покращення можливостей міркування існуючих LLM, а також поширити його на області, що виходять за рамки математики та програмування.

За словами пана Танстолла, R1 «розпочав революцію» в розробці штучного інтелекту.

(TTXVN/В'єтнам+)

Джерело: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp