Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeekは好奇心旺盛です

次世代モデルへの期待が高まる中、中国のAI企業が新たなAI推論方式を開発した。

Zing NewsZing News07/04/2025

DeepSeek は、メディアにあまり登場せず、新しいモデルの研究開発に重点を置いています。写真: SCMP

DeepSeek は清華大学の研究者と協力し、大規模言語モデル (LLM) の推論機能を向上させる新しい方法を導入しました。 4月4日に発表された研究論文で発表されたこの手法は、LLMが一般的なクエリに対してより良く、より速い結果を生成するのに役立ちます。

この手法は、DeepSeek のこれまでの 2 つの成功した手法を組み合わせたものです。 1 つは生成報酬モデリング (GRM) で、AI モデルが以前の結果に基づいて回答を自己評価して改良できるようにします。もう 1 つは自己原理的な批評チューニングです。

どちらの方法も AI の「自己学習」要素に依存しており、直接的な人間からのフィードバックやガイダンスへの依存を減らしながら、人間の期待に近い結果を生み出すことを目指しています。

研究者によると、DeepSeek-GRM は新しい手法であるにもかかわらず、依然として優れたパフォーマンスを実現し、現在最も有名で効果的な AI モデルと競合します。 DeepSeek は GRM モデルをオープンソース化することを計画していますが、具体的なスケジュールはまだ明らかにしていません。

DeepSeek は、V3 プラットフォーム モデルと R1 推論モデルで世界的な話題を呼んだ後、オンライン科学リポジトリ arXiv でこの学術論文を公開し、同社の次の動きに多くの人が興味を抱くようになりました。

ロイター通信は、R1の後継機となるDeepSeek-R2が、以前のモデルがまだ冷めていないことから4月に発売される可能性があると予測している。以前、DeepSeek-R1 は、今日の主要モデルに十分匹敵する、コストと比較した優れたパフォーマンスにより、世界のテクノロジー界に衝撃を与えました。

DeepSeekはこの憶測については沈黙を守っている。しかし、現地の情報によると、DeepSeekのカスタマーケア担当者は、企業顧客とのチャットグループで上記の情報を否定した。

DeepSeekは、起業家の梁文鋒氏によって2023年に杭州で設立され、ここ数か月で急速に世界的な注目を集めています。しかし、同社は世間の名声を利用する代わりに、研究開発にリソースを集中させました。

以前、DeepSeek は V3 モデルをアップグレードし、バージョン DeepSeek-V3-0324 をリリースしました。発表によると、今回のアップデートでは推論機能の強化、フロントエンド Web 開発の最適化、中国語の表記の改善が特徴となっている。

同社は2月に5つのコードリポジトリをオープンソース化し、「完全な透明性をもって進歩する」というコミットメントを表明した。また同社は今月、膨大な量のデータを処理するLLMのパフォーマンスを向上させる「ネイティブスパースアテンション」に関する技術論文を発表した。

米国が中国の技術開発を抑制しようとする中、ディープシークは中国のAI産業の回復力の象徴とみなされている。

出典: https://znews.vn/deepseek-gay-to-mo-post1543900.html


コメント (0)

No data
No data

遺産

仕事

No videos available

ニュース

政治体制

地元

製品