![]() |
بایدو میگوید هوش مصنوعی آنها از ChatGPT و Gemini بهتر است. عکس: بایدو . |
در رویداد Baidu World 2025، غول چینی Baidu از مدل پلتفرم نسل بعدی خود، مجموعهای از ارتقاء محصولات هوش مصنوعی و برنامههای توسعه بینالمللی رونمایی کرد. بر این اساس، ERNIE 5.0 یک مدل اختصاصی است که قادر به پردازش و ایجاد محتوا در قالبهای مختلف مانند متن، تصویر، صدا و ویدیو است.
این گروه قصد دارد به یک بازیگر جهانی در بازار رقابتی فزاینده هوش مصنوعی تبدیل شود. ERNIE 5.0 تنها چند ساعت پس از آن منتشر شد که OpenAI مدل پلتفرم پرچمدار خود را از GPT-5 به GPT-5.1 ارتقا داد و قول داد که مصرف توکن را کاهش داده و تجربه تعامل را با گزینههای انسانی بیشتر بهبود بخشد.
ERNIE-4.5-VL-28B-A3B-Thinking، مدل متنباز اخیراً منتشر شده تحت مجوز Apache 2.0 مناسب برای سازمانها، کاربران فقط میتوانند از طریق وبسایت ERNIE Bot بایدو و API پلتفرم ابری Qianfan برای مشتریان سازمانی به این چتبات جدید دسترسی داشته باشند.
نوع مدل، ERNIE 5.0 Preview 1022 است که علاوه بر نسخه پیشنمایش عمومی که قادر به متعادل کردن انواع مختلف داده است، برای وظایف سنگین متنی بهینه شده است. علاوه بر این، بایدو مجموعهای از بهروزرسانیهای مهم را برای پلتفرم «انسان دیجیتال»، ابزارهای بدون کد و عوامل هوش مصنوعی همه منظوره معرفی کرده است.
ERNIE 5.0 نشاندهندهی تغییری در نحوهی استقرار هوش مصنوعی در مقیاس وسیع است و هدف آن گسترش ردپای هوش مصنوعی خود فراتر از بازار چین است. رابین لی، مدیرعامل این شرکت، گفت: «درونیسازی هوش مصنوعی به یک قابلیت ذاتی تبدیل خواهد شد و هوش مصنوعی را از یک هزینه به منبعی برای بهرهوری تبدیل خواهد کرد.»
ERNIE 5.0 برتری خود را در درک نمودارها و اسناد نشان میدهد. عکس: Baidu. |
نتایج آزمایشها نشان میدهد که ERNIE 5.0 در طیف وسیعی از وظایف، عملکردی نزدیک به مدلهای پلتفرمهای غربی پیشرو یا همسطح با آنها دارد. پیشنمایش ERNIE 5.0 در آزمونهای استدلال چندوجهی، درک اسناد و پاسخ به سؤالات مبتنی بر تصویر، از GPT-5-High شرکت OpenAI و Gemini 2.5 Pro گوگل بهتر یا همسطح آنها عمل میکند.
در عین حال، این مدل قابلیتهای قوی اجرای زبان و کد را نشان میدهد. این شرکت بر توانایی مدیریت ترکیبات ورودی-خروجی چندوجهی در همان مدل تأکید دارد، نه بر ادغام حالتهای داده پس از پردازش، که تیم آن را به عنوان یک وجه تمایز فنی میبیند.
از نظر وظایف مربوط به تصویر، ERNIE 5.0 در OCRBench، DocVQA و ChartQA، سه معیاری که تشخیص سند، درک محتوا و استدلال با دادههای ساختاریافته را اندازهگیری میکنند، بالاترین امتیاز را کسب کرد. بایدو اعلام کرد که این مدل در آزمایشهای مربوط به اسناد و نمودارها، از GPT-5-High و Gemini 2.5 Pro عملکرد بهتری داشته است.
طبق ارزیابی داخلی بایدو، در حوزه تصویربرداری، ERNIE 5.0 در دستهبندیهایی مانند تطبیق معنایی و کیفیت تصویر، به نتایجی همرده یا حتی بهتر از Google Veo3 دست یافت. ادغام چندوجهی این مدل، تولید و تفسیر محتوای بصری را با سطح بالایی از درک زمینهای امکانپذیر میکند.
ERNIE 5.0 از نظر هزینه و بخشبندی معادل سایر مدلهای ردهبالا از رقبای چینی مانند Alibaba است. این محصول از محصول قبلی مانند ERNIE 4.5 Turbo گرانتر است. با این حال، در مقایسه با مدلهای آمریکایی، قیمت این چتبات هنوز در گروه میانرده قرار دارد.
طبق گفتهی Venturebeat، این نشان میدهد که استراتژی بایدو این است که میخواهد بین مدلهای کمهزینه که به ترافیک بالا خدمات میدهند و مدلهای با کارایی بالا برای وظایف پیچیده و استدلال چندوجهی، تمایز قائل شود.
منبع: https://znews.vn/ai-trung-quoc-danh-bai-gpt-5-post1602692.html







نظر (0)