هوش مصنوعی چینی GPT-5 را شکست داد

بایدو می‌گوید هوش مصنوعی آنها از ChatGPT و Gemini بهتر است. عکس: بایدو .

در رویداد Baidu World 2025، غول چینی Baidu از مدل پلتفرم نسل بعدی خود، مجموعه‌ای از ارتقاء محصولات هوش مصنوعی و برنامه‌های توسعه بین‌المللی رونمایی کرد. بر این اساس، ERNIE 5.0 یک مدل اختصاصی است که قادر به پردازش و ایجاد محتوا در قالب‌های مختلف مانند متن، تصویر، صدا و ویدیو است.

این گروه قصد دارد به یک بازیگر جهانی در بازار رقابتی فزاینده هوش مصنوعی تبدیل شود. ERNIE 5.0 تنها چند ساعت پس از آن منتشر شد که OpenAI مدل پلتفرم پرچمدار خود را از GPT-5 به GPT-5.1 ارتقا داد و قول داد که مصرف توکن را کاهش داده و تجربه تعامل را با گزینه‌های انسانی بیشتر بهبود بخشد.

ERNIE-4.5-VL-28B-A3B-Thinking، مدل متن‌باز اخیراً منتشر شده تحت مجوز Apache 2.0 مناسب برای سازمان‌ها، کاربران فقط می‌توانند از طریق وب‌سایت ERNIE Bot بایدو و API پلتفرم ابری Qianfan برای مشتریان سازمانی به این چت‌بات جدید دسترسی داشته باشند.

نوع مدل، ERNIE 5.0 Preview 1022 است که علاوه بر نسخه پیش‌نمایش عمومی که قادر به متعادل کردن انواع مختلف داده است، برای وظایف سنگین متنی بهینه شده است. علاوه بر این، بایدو مجموعه‌ای از به‌روزرسانی‌های مهم را برای پلتفرم «انسان دیجیتال»، ابزارهای بدون کد و عوامل هوش مصنوعی همه منظوره معرفی کرده است.

ERNIE 5.0 نشان‌دهنده‌ی تغییری در نحوه‌ی استقرار هوش مصنوعی در مقیاس وسیع است و هدف آن گسترش ردپای هوش مصنوعی خود فراتر از بازار چین است. رابین لی، مدیرعامل این شرکت، گفت: «درونی‌سازی هوش مصنوعی به یک قابلیت ذاتی تبدیل خواهد شد و هوش مصنوعی را از یک هزینه به منبعی برای بهره‌وری تبدیل خواهد کرد.»

ERNIE 5.0 برتری خود را در درک نمودارها و اسناد نشان می‌دهد. عکس: Baidu.

نتایج آزمایش‌ها نشان می‌دهد که ERNIE 5.0 در طیف وسیعی از وظایف، عملکردی نزدیک به مدل‌های پلتفرم‌های غربی پیشرو یا هم‌سطح با آن‌ها دارد. پیش‌نمایش ERNIE 5.0 در آزمون‌های استدلال چندوجهی، درک اسناد و پاسخ به سؤالات مبتنی بر تصویر، از GPT-5-High شرکت OpenAI و Gemini 2.5 Pro گوگل بهتر یا هم‌سطح آن‌ها عمل می‌کند.

در عین حال، این مدل قابلیت‌های قوی اجرای زبان و کد را نشان می‌دهد. این شرکت بر توانایی مدیریت ترکیبات ورودی-خروجی چندوجهی در همان مدل تأکید دارد، نه بر ادغام حالت‌های داده پس از پردازش، که تیم آن را به عنوان یک وجه تمایز فنی می‌بیند.

از نظر وظایف مربوط به تصویر، ERNIE 5.0 در OCRBench، DocVQA و ChartQA، سه معیاری که تشخیص سند، درک محتوا و استدلال با داده‌های ساختاریافته را اندازه‌گیری می‌کنند، بالاترین امتیاز را کسب کرد. بایدو اعلام کرد که این مدل در آزمایش‌های مربوط به اسناد و نمودارها، از GPT-5-High و Gemini 2.5 Pro عملکرد بهتری داشته است.

طبق ارزیابی داخلی بایدو، در حوزه تصویربرداری، ERNIE 5.0 در دسته‌بندی‌هایی مانند تطبیق معنایی و کیفیت تصویر، به نتایجی هم‌رده یا حتی بهتر از Google Veo3 دست یافت. ادغام چندوجهی این مدل، تولید و تفسیر محتوای بصری را با سطح بالایی از درک زمینه‌ای امکان‌پذیر می‌کند.

ERNIE 5.0 از نظر هزینه و بخش‌بندی معادل سایر مدل‌های رده‌بالا از رقبای چینی مانند Alibaba است. این محصول از محصول قبلی مانند ERNIE 4.5 Turbo گران‌تر است. با این حال، در مقایسه با مدل‌های آمریکایی، قیمت این چت‌بات هنوز در گروه میان‌رده قرار دارد.

طبق گفته‌ی Venturebeat، این نشان می‌دهد که استراتژی بایدو این است که می‌خواهد بین مدل‌های کم‌هزینه که به ترافیک بالا خدمات می‌دهند و مدل‌های با کارایی بالا برای وظایف پیچیده و استدلال چندوجهی، تمایز قائل شود.

منبع: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html