Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek любопытен

Китайская компания, занимающаяся разработкой искусственного интеллекта, разработала новый метод вывода на основе искусственного интеллекта на фоне растущих ожиданий от моделей следующего поколения.

Zing NewsZing News07/04/2025

DeepSeek сосредоточен на исследовании и разработке новых моделей, а не на активном появлении в СМИ. Фото: SCMP .

В сотрудничестве с исследователями из Университета Цинхуа компания DeepSeek представила новый метод улучшения возможностей вывода больших языковых моделей (LLM). Метод, описанный в исследовательской статье, опубликованной 4 апреля, помогает магистрам права (LLM) получать более качественные и быстрые результаты для распространенных запросов.

Эта методика представляет собой комбинацию двух предыдущих успешных методов DeepSeek. Одним из них является генеративное моделирование вознаграждения (GRM), которое позволяет модели ИИ самостоятельно оценивать и совершенствовать свои ответы на основе предыдущих результатов, а другим — настройка на основе принципа критики.

Оба метода основаны на элементе «самообучения» ИИ, что снижает зависимость от прямой обратной связи или руководства со стороны человека, но при этом стремится выдавать результаты, более близкие к человеческим ожиданиям.

По словам исследователей, несмотря на новизну метода, DeepSeek-GRM по-прежнему демонстрирует выдающуюся производительность и конкурирует с самыми известными и эффективными моделями ИИ на сегодняшний день. DeepSeek планирует открыть исходный код своих моделей GRM, но пока не называет конкретных сроков.

После того, как ее модель платформы V3 и модель вывода R1 произвели фурор во всем мире, компания DeepSeek опубликовала эту научную статью в научном онлайн-репозитории arXiv, заставив многих заинтересоваться следующими шагами компании.

Reuters прогнозирует, что DeepSeek-R2, преемник R1, может быть запущен в апреле, поскольку предыдущие модели еще не остыли. Ранее DeepSeek-R1 потряс мировой технологический мир благодаря своим выдающимся характеристикам по сравнению с ценой, вполне конкурентоспособной с ведущими современными моделями.

DeepSeek хранит молчание по поводу этих предположений. Однако, по местной информации, сотрудник службы поддержки клиентов DeepSeek опроверг вышеуказанную информацию в чате с корпоративными клиентами.

Основанная в Ханчжоу в 2023 году предпринимателем Ляном Вэньфэном, компания DeepSeek за последние несколько месяцев быстро привлекла к себе внимание мировой общественности. Но вместо того, чтобы извлечь выгоду из публичной известности, компания сосредоточила свои ресурсы на исследованиях и разработках.

Ранее DeepSeek обновила модель V3, выпустив версию DeepSeek-V3-0324. Согласно объявлению, это обновление отличается улучшенными возможностями вывода, оптимизацией для разработки интерфейсных веб-приложений и улучшенным написанием на китайском языке.

В феврале стартап также открыл исходный код пяти репозиториев, подтвердив свою приверженность «прогрессу с полной прозрачностью». Также в этом месяце компания опубликовала технический документ о «исконном разреженном внимании», которое повышает производительность LLM при обработке огромных объемов данных.

DeepSeek рассматривается как символ устойчивости китайской индустрии искусственного интеллекта на фоне усилий США по сдерживанию технологического развития страны.

Источник: https://znews.vn/deepseek-gay-to-mo-post1543900.html


Комментарий (0)

No data
No data

Та же категория

Исследуйте первобытный лес Фукуока
Вид на залив Халонг сверху
Наслаждайтесь лучшими фейерверками в ночь открытия Международного фестиваля фейерверков в Дананге 2025 года
Международный фестиваль фейерверков в Дананге 2025 (DIFF 2025) — самый продолжительный в истории

Тот же автор

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт