![]() |
DeepseekMath-V2モデルは、数学の問題を解く際に優れたパフォーマンスを発揮します。写真: Decoder 。 |
Deepseekは、権威ある数学コンテストで金メダル級の成績を収めたDeepseekMath-V2モデルを発表しました。この動きにより、この中国企業は、言語モデル推論で世界をリードする米国の主要AI研究機関と直接競合することになります。
技術資料によると、DeepseekMath-V2は2025年国際数学オリンピック(IMO)と2024年中国数学オリンピック(CMO)で金メダル級の成績を達成しました。パトナム試験では118/120点を獲得し、史上最高得点の人間参加者の90点を大きく上回りました。これらの結果は、DeepseekMath-V2が複雑な問題に対応できる能力を証明しています。
この中国企業は、従来のAIモデルの限界は、正しい答えは出せるものの、有効な解決策を提示できないことだったと説明しました。これを克服するために、DeepseekMath-V2は、正確性の評価、反論の確認、最終結果の提示という多段階のプロセスを採用しています。この動作方法により、システムはリアルタイムで自己レビューを行い、解決策を改良することで、結論は正しいものの推論が間違っているという状況を回避できます。
注目すべきは、Deepseekのドキュメントには、コンピュータやインタープリタなどの外部ツールを使用するモデルについては一切記載されていないことです。テスト設定では、すべての結果が完全に自然言語で生成されることが示されています。
Deepseekは、パフォーマンスの向上は専門的な数学ソフトウェアに依存せず、解を自己批判し自己修正する能力から生まれると強調しています。難しい問題の場合、システムは複数の解を並列に生成することで計算をスケールアップし、最終結果の信頼性を高めます。
DeepseekMath-V2の登場は、OpenAIとGoogle DeepMindが、未発表モデルがIMOで金メダルを獲得したと発表した直後に行われました。これは、これまで大規模言語モデルの能力を超えた偉業でした。しかし、これらのシステムに関する情報は現時点では非常に限られており、OpenAIの研究者が、より数学的に強力なバージョンが今後数か月以内に利用可能になると述べたことだけが残っています。
アメリカ企業の秘密主義とは対照的に、Deepseekは自社の手法と技術アーキテクチャの詳細を公開することを選択しました。このアプローチにより、同社は透明性を示すと同時に、アメリカのAIエコシステムへの競争圧力を生み出すことができます。エコノミスト誌によると、一部のアメリカのスタートアップ企業はコスト削減のため、中国の低コストのオープンソースモデルへの移行を検討しています。
出典: https://znews.vn/deepseek-pha-ky-luc-post1606990.html







コメント (0)