DeepSeek は王座を奪われました。

アリババが発表した新技術「Qwen3」。写真：サウスチャイナ・モーニング・ポスト。

最新のAIベンチマークテストによると、アリババが新たにリリースした人工知能モデル「Qwen3」は、DeepSeekのR1を上回り、世界最高評価のオープンソースモデルとなった。

具体的には、ChatGPTのような生成型AIサービスの基盤技術である大規模言語モデル（LLM）を評価する独立系プラットフォームであるLiveBenchのデータによると、Qwen3はテストでR1を上回ったことが示されている。

オープンソースAIモデルの能力評価には、プログラミング、数学、データ分析、および言語教育が含まれる。

アリババは4月28日にQwen3 AIモデルシリーズを発表した。同社は、このチャットボットはOpenAIやGoogleの現行最高レベルのモデルに匹敵、あるいは場合によっては凌駕する可能性があると主張している。

最大2350億個のパラメータを持つQwen3は、それぞれ約2360億個と1750億個のパラメータを持つDeepSeek-V2とOpenAI GPT-4に匹敵する性能を備えています。この一連のモデルがリリースされ次第、ユーザーはAI開発プラットフォームであるHugging FaceとGitHubでオープンライセンスの下でダウンロードできるようになります。

同社によれば、Qwen3シリーズにはハイブリッドモデルが含まれており、複雑な問題解決のための推論に時間を柔軟に割り当てたり、単純な要求に迅速に対応したりできるという。このモデルでは、推論機能によって情報の正確性を自己検証できるが、これにはかなりの時間遅延が伴う。

この設計により、ユーザーは各タスクに適切な予算配分を容易に行うことができます。さらに、このモデルは世界中の多くの競合他社から学習しています。

Qwen3は、DeepSeekと同様の「エキスパート混合モデル」（MoE）アーキテクチャを採用することで、トレーニングコストを大幅に削減しながら計算性能を最適化できます。この手法では、タスクを多数の独立した部分に分割し、実行に必要なデータ量のみを収集します。

開発チームによると、Qwen3は最大119言語に対応し、約36兆トークン（27兆語に相当）のデータセットで学習されている。学習データは、教科書、質疑応答集、プログラミングコード、さらにはAI生成データなど、さまざまなソースから収集されている。

オープンソースランキングでトップに立ったにもかかわらず、LiveBenchの拡張ベンチマークテストによると、Qwen3は依然として世界有数のクローズドソースAIモデルに劣っている。中でも特に有名なのは、OpenAIのo3、GoogleのGemini Pro 2.5、そしてAnthropicのClaude 3.7である。

現在、マイクロソフトがサポートする最も高度なOpenAIモデルであるo3-mini highは、世界中のAIモデル総合ランキングでトップに立っている。

出典：https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html