![]() |
Baiduは自社のAIがChatGPTやGeminiよりも優れていると述べている。写真: Baidu |
中国大手企業Baiduは、Baidu World 2025イベントにおいて、次世代プラットフォームモデル、一連のAI製品のアップグレード、そして国際展開計画を発表しました。ERNIE 5.0は、テキスト、画像、音声、 動画など、複数のフォーマットでコンテンツを処理・作成できる独自のモデルです。
このグループは、競争が激化するAI市場において、グローバルプレーヤーとなることを目指しています。ERNIE 5.0は、OpenAIが主力プラットフォームモデルをGPT-5からGPT-5.1にアップグレードしてからわずか数時間後にリリースされました。GPT-5.1は、トークン消費量の削減と、より多くの人間的な選択肢によるインタラクション体験の向上を約束しています。
エンタープライズ向けのApache 2.0ライセンスの下で最近リリースされたオープンソースモデルであるERNIE-4.5-VL-28B-A3B-Thinkingでは、ユーザーはBaiduのERNIE Botウェブサイトと機関顧客向けのQianfan Cloud Platform APIを通じてのみ新しいチャットボットにアクセスできます。
モデルのバリアントはERNIE 5.0 Preview 1022で、テキスト中心のタスクに最適化されています。また、複数のデータタイプをバランスよく処理できる一般プレビュー版も含まれています。さらに、Baiduは「デジタルヒューマン」プラットフォーム、ノーコードツール、汎用AIエージェントにも一連の重要なアップグレードを導入しました。
ERNIE 5.0は、AIの大規模導入方法に変革をもたらし、中国市場以外にもAIの活用範囲を拡大することを目指しています。「AIの内製化は、AIの本質的な能力となり、AIをコストから生産性の源泉へと変革するでしょう」と、CEOのロビン・リー氏は述べています。
ERNIE 5.0はグラフと文書の理解において優れた性能を発揮します。写真: Baidu。 |
テスト結果によると、ERNIE 5.0は幅広いタスクにおいて、欧米の主要プラットフォームモデルとほぼ同等、あるいは同等の性能を発揮しました。ERNIE 5.0 Previewは、マルチモーダル推論、文書理解、画像ベースの質問応答のテストにおいて、OpenAIのGPT-5-HighやGoogleのGemini 2.5 Proを上回る、あるいは同等の性能を発揮しました。
同時に、このモデルは強力な言語およびコード実行能力を備えています。同社は、後処理データモードを連結するのではなく、同一モデル内でマルチモーダルな入出力の組み合わせを処理できる能力を重視しており、チームはこれを技術的な差別化要因と見ています。
画像タスクに関しては、ERNIE 5.0は、文書認識、コンテンツ理解、構造化データを用いた推論を測定する3つのベンチマークであるOCRBench、DocVQA、ChartQAで最高点を獲得しました。Baiduによると、ERNIE 5.0は文書とグラフを含むテストにおいて、GPT-5-HighとGemini 2.5 Proの両方を上回ったとのことです。
Baiduの社内評価によると、画像分野においてERNIE 5.0は、セマンティックマッチングや画像品質などのカテゴリーにおいて、Google Veo3と同等かそれ以上の成果を達成しました。このモデルのマルチモーダル統合により、高度な文脈理解に基づく視覚コンテンツの生成と解釈が可能になります。
ERNIE 5.0は、Alibabaなどの中国競合のハイエンドモデルと同等の価格帯とセグメントに位置付けられています。ERNIE 4.5 Turboなどの前製品よりも高価ですが、米国製モデルと比較すると、このチャットボットの価格は依然としてミッドレンジグループにとどまっています。
Venturebeat によると、これは、高トラフィックに対応する低コストのモデルと、複雑なタスクやマルチモーダル推論のための高性能モデルを明確に区別したいという Baidu の戦略を示しているという。
出典: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







コメント (0)