Vietnam.vn - Nền tảng quảng bá Việt Nam

Новое исследование раскрывает секрет успеха DeepSeek

По данным DeepSeek, модель искусственного интеллекта R1 не обучалась с использованием данных модели OpenAI, хотя компания признала, что базовая модель обучалась на веб-данных, которые могут включать контент, сгенерированный ИИ.

VietnamPlusVietnamPlus18/09/2025

Модель искусственного интеллекта R1 китайского стартапа DeepSeek, запуск которой в январе потряс американский фондовый рынок, была опубликована в первом рецензируемом исследовании, демонстрирующем, как компания разработала мощную степень магистра права всего за 300 000 долларов.

R1 разработан для решения таких задач, требующих рассуждений, как математика и программирование, что делает его недорогим конкурентом инструментам, разработанным американскими технологическими гигантами.

Это модель «открытого веса», которую можно загрузить бесплатно. На данный момент она является самой популярной моделью на платформе Hugging Face, ее скачали более 10,9 миллионов раз.

Исследование Nature, являющееся обновленной версией январской рукописи, впервые показало, что обучение R1 обошлось всего в 294 000 долларов США, в дополнение к примерно 6 миллионам долларов США, потраченным на создание базовой модели.

Эта цифра намного ниже десятков миллионов долларов, которые, как утверждается, потратили конкуренты.

DeepSeek заявил, что R1 обучался преимущественно с использованием чипов Nvidia H800, экспорт которых в Китай запрещен США с 2023 года.

Прорывом R1 стало использование «чистого обучения с подкреплением», когда модель обучается методом проб и ошибок и вознаграждается за правильные ответы, а не на примерах, выбранных людьми. R1 также оценивает свои собственные усилия, используя внутренние оценки, метод, называемый «оптимизацией относительной групповой политики», что способствует повышению производительности.

«Строгий процесс экспертной оценки помогает подтвердить ценность и надёжность модели», — говорит исследователь Хуан Сан (Университет штата Огайо). «Другим компаниям стоит поступить так же».

Льюис Танстолл, инженер по машинному обучению в Hugging Face, сказал, что это важный прецедент, поскольку прозрачность в разработке ИИ помогает точнее оценивать риски.

DeepSeek утверждает, что R1 не обучался с использованием данных моделей OpenAI, хотя признает, что базовая модель обучалась на веб-данных, которые могут включать контент, сгенерированный ИИ.

Эксперты утверждают, что, хотя это и трудно проверить абсолютно, имеющиеся на сегодняшний день данные свидетельствуют о том, что чистого улучшения достаточно для достижения высокой производительности.

В тесте ScienceAgentBench R1 не занял лидирующие позиции по точности, но показал хороший баланс между эффективностью и стоимостью. Теперь исследователи планируют применить метод DeepSeek для улучшения способности к рассуждению существующих LLM-программистов, а также распространить его на области, выходящие за рамки математики и программирования.

По словам г-на Танстолла, R1 «начал революцию» в развитии искусственного интеллекта./.

(TTXVN/Вьетнам+)

Источник: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


Комментарий (0)

No data
No data

Та же тема

Та же категория

Герой Труда Тхай Хыонг был награжден медалью Дружбы лично президентом России Владимиром Путиным в Кремле.
Заблудившись в сказочном моховом лесу на пути к покорению Фу Са Пхина
Сегодня утром пляжный город Куинён «мечтателен» в тумане.
Завораживающая красота Сапы в сезон «охоты за облаками»

Тот же автор

Наследство

Фигура

Бизнес

Хошимин привлекает инвестиции от предприятий с прямыми иностранными инвестициями через новые возможности

Текущие события

Политическая система

Местный

Продукт