アリババが発表した新技術「Qwen3」。写真: SCMP |
AI界の最新ベンチマークテストによると、アリババが新たに発表した人工知能モデルQwen3は、DeepSeekのR1を上回り、 世界最高ランクのオープンソースモデルとなった。
具体的には、ChatGPT のような生成 AI サービスの基盤となるテクノロジーである大規模言語モデル (LLM) をベンチマークする独立プラットフォームである LiveBench のデータによると、テストでは Qwen3 が R1 を上回ったことが示されています。
オープンソース AI モデルの機能のレビューには、プログラミング、数学、データ分析、言語指導が含まれます。
Qwen3と呼ばれるAIモデルシリーズが4月28日にアリババからリリースされました。同社によると、このチャットボットは現在OpenAIやGoogleが提供している最高のモデルに匹敵し、場合によっては凌駕することもあるとのことです。
Qwen3は最大2,350億個のパラメータを有し、それぞれ約2,360億個と1,750億個のパラメータを持つDeepSeek-V2やOpenAI GPT-4と同等の性能を備えています。一連のモデルがリリースされ次第、ユーザーはAI開発プラットフォームHugging FaceとGitHubからオープンライセンスでダウンロードできるようになります。
同社によると、Qwen3コレクションにはハイブリッドモデルが含まれており、複雑な問題を解決したり、単純なリクエストに迅速に対応したりするために推論時間を柔軟に調整できるという。この場合、推論によってモデルは情報の正確性を自己チェックできるが、レイテンシが高くなる。
この設計により、ユーザーは特定のタスクごとに適切な予算を簡単に割り当てることができます。さらに、このモデルは世界中の多くの競合他社から学習します。
Qwen3は、DeepSeekに類似した「Mixture of Experts(MoE)」アーキテクチャを採用することで、学習コストのほんの一部で計算効率を最大化できます。これは、タスクを個々の部分に分割し、実行に必要なディープラーニングデータのみを推奨するアプローチです。
開発チームによると、Qwen3は最大119の言語をサポートし、約36兆トークン(27兆語に相当)のデータセットで学習されています。学習データは、教科書、質問と回答のセット、プログラミングコード、自己生成AIなど、様々なソースから取得されます。
オープンソースランキングでトップを占めているにもかかわらず、LiveBenchによる広範なテストでは、Qwen3は世界をリードするクローズドソースAIモデル、特にOpenAIのo3、GoogleのGemini Pro 2.5、AnthropicのClaude 3.7に遅れをとっていることがわかりました。
現在、マイクロソフトが支援するOpenAIの最高級モデル「o3-mini high」が、世界のAIモデル総合ランキングでトップに立っています。
出典: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










コメント (0)