アリババが発表した新技術「Qwen3」。写真: SCMP |
最新のAIベンチマークテストによると、アリババが新たにリリースしたQwen3人工知能モデルは、DeepSeekのR1を上回り、 世界最高評価のオープンソースモデルとなった。
具体的には、ChatGPT のような生成 AI サービスの基盤技術である大規模言語モデル (LLM) を評価する独立プラットフォームである LiveBench のデータによると、Qwen3 はテストで R1 を上回ったことが示されています。
オープンソース AI モデルの機能の評価には、プログラミング、数学、データ分析、言語指導が含まれます。
アリババは4月28日にQwen3 AIモデルシリーズをリリースしました。同社は、このチャットボットはOpenAIやGoogleの最新モデルに匹敵し、場合によっては凌駕する可能性があると主張しています。
Qwen3は最大2,350億個のパラメータを備え、約2,360億個のパラメータを持つDeepSeek-V2や約1,750億個のパラメータを持つOpenAI GPT-4に匹敵する性能を備えています。この一連のモデルがリリースされ次第、ユーザーはAI開発プラットフォームHugging FaceとGitHubからオープンライセンスでダウンロードできるようになります。
同社によると、Qwen3コレクションにはハイブリッドモデルが含まれており、複雑な問題を解決したり、単純な要求に迅速に対応したりするために、推論に柔軟に時間を割り当てることができる。このモデルでは、推論機能によって情報の正確性の自己検証が可能になるが、これには大きなタイムラグが伴う。
この設計により、ユーザーはそれぞれのタスクに適切な予算を割り当てることが容易になります。さらに、このモデルは世界中の多くの競合他社から学習します。
Qwen3は、DeepSeekに類似した「Mixture of Experts(MoE)」アーキテクチャを採用することで、学習コストをごくわずかに保ちながら計算性能を最適化できます。この手法では、タスクを多数の独立した部分に分割し、各タスクを実行するために必要なデータ集約型データのみを必要とします。
開発チームによると、Qwen3は最大119の言語をサポートし、約36兆トークン(27兆語に相当)のデータセットで学習されています。学習データは、教科書、質問と回答のセット、プログラミングコード、さらにはAI生成データなど、様々なソースから取得されます。
オープンソースランキングでトップに立ったにもかかわらず、LiveBenchの拡張ベンチマークテストでは、Qwen3が世界をリードするクローズドソースAIモデルに依然として遅れをとっていることが示されました。これらのモデルの中で最も顕著なのは、OpenAIのo3、GoogleのGemini Pro 2.5、そしてAnthropicのClaude 3.7です。
現在、Microsoft がサポートする最も先進的な OpenAI モデルである o3-mini high が、世界中の AI モデルの総合ランキングでトップを占めています。
出典: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html






コメント (0)