複雑な問題を自然言語、解答、そして明確で一貫した議論を用いて解くことは、数学が得意な生徒にとっても容易ではありません。しかし、DeepSeekはそれを可能にするAIモデルDeepSeekMath-V2を開発しました。

DeepSeekは、国際試験レベルの問題を解くことができるAIモデルを作成し、高い評価を得ました(図:AI)。
評価において、DeepSeekMath-V2 は、2025 年の国際数学オリンピック (IMO) と 2024 年の中国数学オリンピック (CMO) の問題解決において金メダルレベルのスコアを達成しました。
AI モデルの数学的解釈および推論能力を評価する IMO-ProofBench テストに参加した際に、DeepSeek の DeepSeekMath-V2 は、Google の DeepMind、xAI の Grok、OpenAI の GPT-5 などの他の AI モデルと比較して優れたスコアを達成しました...
注目すべきは、DeepSeekのAIモデルが2024年のPutnam Math Competitionを解いた際に118/120のスコアを獲得したのに対し、このコンテストの最高位の人物はわずか90点だったことである。Putnam Competitionは、毎年12月に開催される、大学生を対象とした世界で最も難しく権威のある数学コンテストとされている。
国際コンテストでは、正確な数値の解答が求められない問題が多く、解答に至るまでの推論に基づいて採点されます。しかし、DeepSeekMath-V2は人間と同様に自然言語で緻密な推論を行う能力を示しており、このAIモデルが高得点を獲得するのに貢献しています。
DeepSeekは、AIモデルが正確な回答と強力な議論を導き出せるよう、2つの大規模な言語モデルを構築し、それらを相互に比較させたと述べています。一方のモデルは数学的な議論と証明を生成する「証明者」として機能し、もう一方のモデルは提示された議論を検証する「審査員」として機能します。
この作業方法は、弱い仮説や議論を排除し、ソリューションを最適化して正しい答えを見つけ、厳密に議論することに焦点を当てるのに役立ちます。
DeepSeekMath-V2 はオープンソースとして開発されており、コミュニティがソースコードを変更してさまざまな目的で使用できます。
DeepSeekは、DeepSeekMath-V2で達成された画期的な進歩は、より強力で信頼性の高い数学AIシステムを構築するための基盤を築くだろうと述べています。
DeepSeekは、1月末にAI R1モデルを発売し、高速かつ正確な応答速度を提供し、世界的に大きな話題を呼んだ中国のテクノロジー企業です。
R1のハイライトは、DeepSeekがこのAIモデルの開発とトレーニングに費やした金額が約650万ドルにとどまったことです。アメリカのテクノロジー企業のように、独自のAIモデルのトレーニングと運用に数十億ドルを費やす必要はありませんでした。
さらに、R1はDeepSeekによって旧世代のAIチップをベースに開発・運用されています。これは、米国政府の禁輸措置により中国企業がハイエンドAIチップを発注できないためです。しかし、R1は依然として優れた処理能力とユーザーからの要求への対応速度を示しています。
DeepSeekの登場により、米国はAIモデル開発競争における独占状態を失い、同時に新たな競争の幕開けとなりました。テクノロジー企業は、知能や処理能力だけに焦点を絞るのではなく、AIモデル開発プロセスにおける経済効率の問題に、より一層注意を払うようになりました。
出典: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm






コメント (0)