Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeekの王座奪還

Qwen3と呼ばれるアリババのAIモデルは、プログラミング、数学、データ分析を含むオープンソースモデルの能力を評価するLiveBenchテストでR1を超えた。

ZNewsZNews06/05/2025

アリババが発表した新技術「Qwen3」。写真: SCMP

AI界の最新ベンチマークテストによると、アリババが新たに発表した人工知能モデルQwen3はDeepSeekのR1を上回り、世界最高ランクのオープンソースモデルとなった。

具体的には、ChatGPT のような生成 AI サービスの基盤となるテクノロジーである大規模言語モデル (LLM) をベンチマークする独立プラットフォームである LiveBench のデータによると、Qwen3 はテストで R1 を上回ったことが示されています。

このレビューでは、プログラミング、数学、データ分析、言語指導などのオープンソース AI モデルの機能を評価します。

Qwen3と呼ばれるAIモデルシリーズが4月28日にアリババからリリースされました。同社によると、このチャットボットは現在OpenAIやGoogleが提供している最高のモデルに匹敵し、場合によってはそれを上回ることもできるとのことです。

Qwen3は最大2,350億個のパラメータを有し、それぞれ約2,360億個と1,750億個のパラメータを持つDeepSeek-V2やOpenAI GPT-4と同等の性能を備えています。一連のモデルがリリースされ次第、ユーザーはAI開発プラットフォームHugging FaceとGitHubからオープンライセンスでダウンロードできるようになります。

同社によると、Qwen3コレクションにはハイブリッドモデルが含まれており、複雑な問題を解決するための柔軟な推論機能や、単純なリクエストへの迅速な対応が可能になる。この場合、推論機能によりモデルは情報の正確性を自己チェックできるが、レイテンシが高くなるというデメリットがある。

この設計により、ユーザーは特定のタスクごとに適切な予算を簡単に割り当てることができます。さらに、このモデルは世界中の多くの競合他社から学習します。

Qwen3は、DeepSeekに類似した「Mixture of Experts(MoE)」アーキテクチャを採用することで、学習コストのほんの一部で計算効率を最大化できます。これは、タスクを個々の部分に分割し、実行に必要な量のディープラーニングデータのみを推奨する手法です。

開発チームによると、Qwen3は最大119の言語をサポートし、約36兆トークン(27兆語に相当)のデータセットで学習されています。学習データは、教科書、質問と回答のセット、プログラミングコード、自己生成AIなど、様々なソースから取得されます。

オープンソースランキングでトップに立っているにもかかわらず、LiveBenchによる広範なテストでは、Qwen3は依然として世界をリードするクローズドソースAIモデル、特にOpenAIのo3、GoogleのGemini Pro 2.5、AnthropicのClaude 3.7に遅れをとっていることがわかりました。

現在、マイクロソフトが支援するOpenAIの最高級モデル「o3-mini high」が、世界のAIモデル総合ランキングでトップに立っています。

出典: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html


コメント (0)

No data
No data

遺産

人物

企業

No videos available

ニュース

政治体制

地方

商品