アリババが発表した新技術「Qwen3」。写真:サウスチャイナ・モーニング・ポスト。 |
最新のAIベンチマークテストによると、アリババが新たにリリースした人工知能モデル「Qwen3」は、DeepSeekのR1を上回り、 世界最高評価のオープンソースモデルとなった。
具体的には、ChatGPTのような生成型AIサービスの基盤技術である大規模言語モデル(LLM)を評価する独立系プラットフォームであるLiveBenchのデータによると、Qwen3はテストでR1を上回ったことが示されている。
オープンソースAIモデルの能力評価には、プログラミング、数学、データ分析、および言語教育が含まれる。
アリババは4月28日にQwen3 AIモデルシリーズを発表した。同社は、このチャットボットはOpenAIやGoogleの現行最高レベルのモデルに匹敵、あるいは場合によっては凌駕する可能性があると主張している。
最大2350億個のパラメータを持つQwen3は、それぞれ約2360億個と1750億個のパラメータを持つDeepSeek-V2とOpenAI GPT-4に匹敵する性能を備えています。この一連のモデルがリリースされ次第、ユーザーはAI開発プラットフォームであるHugging FaceとGitHubでオープンライセンスの下でダウンロードできるようになります。
同社によれば、Qwen3シリーズにはハイブリッドモデルが含まれており、複雑な問題解決のための推論に時間を柔軟に割り当てたり、単純な要求に迅速に対応したりできるという。このモデルでは、推論機能によって情報の正確性を自己検証できるが、これにはかなりの時間遅延が伴う。
この設計により、ユーザーは各タスクに適切な予算配分を容易に行うことができます。さらに、このモデルは世界中の多くの競合他社から学習しています。
Qwen3は、DeepSeekと同様の「エキスパート混合モデル」(MoE)アーキテクチャを採用することで、トレーニングコストを大幅に削減しながら計算性能を最適化できます。この手法では、タスクを多数の独立した部分に分割し、実行に必要なデータ量のみを収集します。
開発チームによると、Qwen3は最大119言語に対応し、約36兆トークン(27兆語に相当)のデータセットで学習されている。学習データは、教科書、質疑応答集、プログラミングコード、さらにはAI生成データなど、さまざまなソースから収集されている。
オープンソースランキングでトップに立ったにもかかわらず、LiveBenchの拡張ベンチマークテストによると、Qwen3は依然として世界有数のクローズドソースAIモデルに劣っている。中でも特に有名なのは、OpenAIのo3、GoogleのGemini Pro 2.5、そしてAnthropicのClaude 3.7である。
現在、マイクロソフトがサポートする最も高度なOpenAIモデルであるo3-mini highは、世界中のAIモデル総合ランキングでトップに立っている。
出典:https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html






コメント (0)