アリババ、GPT-4oやDeepSeek V3に対抗する言語モデルを発表

[広告_1]

このアリババAIモデルは、Mixture-of-Experts（MoE）アーキテクチャ上に構築されており、20兆トークン以上の学習済みです。開発者によると、Qwen2.5-Maxは「インテリジェンス能力の大幅な進歩」を示しており、現在使用可能です。

Alibaba ra mắt mô hình ngôn ngữ cạnh tranh với GPT-4o và DeepSeek V3- Ảnh 1. — 初期結果では、Qwen2.5-Max が競合製品よりも強力であることが示されました。

Qwen2.5-Maxは、パフォーマンスと精度を向上させるだけでなく、テキスト分析、翻訳、コンテンツ作成など、コンテキストの深い理解を必要とするタスクをより適切に処理できるようになります。アリババはブログ投稿で、「Qwen2.5-Maxは、複雑なクエリの処理と適切な回答の提供において大きな進歩を示しています」と述べています。

アリババの新モデルから得られた印象的な数字

Qwen2.5-Maxモデルは、MMLU-Pro、LiveCodeBench、LiveBench、Arena-Hardなど、多くの重要なベンチマークでテストされています。その結果、Qwen2.5-MaxはArena-Hard、LiveBench、LiveCodeBenchなどのテストにおいてDeepSeek V3を上回り、MMLU-Proでは競争力のある結果を示しました。GPT-4oやClaude-3.5-Sonnetなどの他の主要モデルと比較しても、Qwen2.5-Maxは優位性を示しています。

Alibaba Cloudは、Qwen2.5-Maxを自社のクラウドサービスに統合し、データ処理の自動化からチャットボットによる顧客インタラクションの改善、ビジネスプロセスの最適化まで、顧客の様々な課題解決を支援する予定です。AIモデルは現在Qwen Chatサービスを通じて利用可能で、ユーザーは対話したり、その機能をテストしたり、様々な機能を試したりできます。また、APIも開発者向けに公開されています。アクセスするには、ユーザーはAlibaba Cloudに登録し、Model Studioサービスを有効化してAPIキーを作成する必要があります。

[広告2]
出典: https://thanhnien.vn/alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3-185250129152256505.htm