«هیولای هوش مصنوعی» بایدو، ERNIE 5.1، با ۹۴ درصد هزینه کمتر کار می‌کند.

پرچم‌دار بایدو، ERNIE، که اخیراً به نسخه ۵.۱ به‌روزرسانی شده است، با قابلیت‌های بی‌سابقه‌اش در صرفه‌جویی در هزینه، جامعه فناوری جهانی را شگفت‌زده کرده است.

Báo Khoa học và Đời sống•15/05/2026

در بحبوحه رقابت جهانی هوش مصنوعی که میلیاردها دلار برای قدرت محاسباتی هزینه می‌کند، بایدو که اغلب به عنوان "گوگل چین" شناخته می‌شود، با راه‌اندازی رسمی مدل زبان بزرگ ERNIE 5.1 خود، شوک بزرگی ایجاد کرده است.

برجسته‌ترین جنبه نه تنها در قابلیت‌های پردازش برتر آن، بلکه در ارزش اقتصادی چشمگیر آن نیز نهفته است: هزینه آموزش این مدل تقریباً ۹۴٪ کمتر از سیستم‌های هوش مصنوعی در مقیاس مشابه است. این به عنوان یک راه حل جدید برای مشکل بهینه‌سازی منابع در نسل بعدی هوش مصنوعی دیده می‌شود.

فناوری فشرده‌سازی شبکه و استراتژی «یک بار آموزش، همه را آموزش بده»

برای درک اینکه چرا بایدو توانست هزینه‌ها را تا چنین حد باورنکردنی کاهش دهد، باید به نحوه ساخت ERNIE 5.1 توسط آنها نگاه کرد.

بایدو به جای دنبال کردن مسیر سنتی آموزش یک مدل کاملاً جدید از ابتدا، یک روش «پیش‌آموزش الاستیک چندبعدی» را اتخاذ کرد. به طور خاص، ERNIE 5.1 یک نهاد کاملاً مستقل نیست، بلکه بر اساس پایه‌های نسخه قبلی خود، ERNIE 5.0 (که در ژانویه 2026 عرضه شد) توسعه یافته است.

بایدو از یک چارچوب آموزشی انعطاف‌پذیر به نام «یکبار برای همیشه» استفاده کرده است. این شرکت به جای اجرای آموزش‌های جداگانه و پرهزینه برای هر اندازه مدل مختلف، یک «خانواده» کامل از مدل‌ها با اندازه‌های مختلف را در یک اجرا بهینه می‌کند.

2ffca8ca25c14b56a38a3c3a7917bb8etplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — روش آموزش «الاستیسیته چندبعدی» هزینه ارنی ۵.۱ را ۹۴٪ کاهش می‌دهد.

این مدل‌ها وزن‌های مشترکی دارند اما از نظر عمق، وسعت و تعداد بلوک‌های خبره فعال‌شده متفاوت هستند. بایدو از معماری عظیم ERNIE 5.0 با تقریباً ۲.۴ تریلیون پارامتر، یک زیرشبکه بهینه‌شده برای ایجاد ERNIE 5.1 استخراج کرد.

نتیجه، یک مدل ساده‌سازی‌شده است که تعداد کل پارامترها تنها حدود یک‌سوم مدل اصلی است. به‌ویژه، تعداد پارامترهای عملیاتی، یعنی آن بخش‌هایی که در واقع در پردازش بازخورد در یک مکالمه شرکت می‌کنند، به نصف کاهش یافته است.

به ارث بردن پایگاه دانش گسترده از مدل «والد» خود بدون تکرار کل فرآیند آموزش پرهزینه، کلید صرفه‌جویی تا ۹۴ درصد از بودجه بایدو است.

علاوه بر این، بایدو سیستم یادگیری تقویتی خود را به طور کامل بازسازی کرد. به جای پیوند دادن سفت و سخت به‌روزرسانی‌های مدل، تولید بازخورد و ارزیابی اجرا، آنها را به زیرسیستم‌های مستقلی تقسیم کردند که توسط یک واحد کنترل مرکزی هماهنگ می‌شوند.

این امر به هر جزء اجازه می‌دهد تا روی مناسب‌ترین سخت‌افزار اجرا شود و تضمین می‌کند که گلوگاه در یک مرحله، کل فرآیند را کند نمی‌کند.

برای رفع مشکل سوگیری محاسباتی در مدل‌های ترکیبی از متخصصان (MoE)، بایدو همچنین یک کتابخانه محاسباتی استاندارد با دقت پایین پیاده‌سازی کرد که بی‌ثباتی را بدون کاهش سرعت پردازش به نصف کاهش داد.

با یک فرآیند آموزشی چهار مرحله‌ای، به «اثر الاکلنگی» بپردازید.

یک چالش ذاتی در آموزش مدل‌های بزرگ هوش مصنوعی، «اثر الاکلنگی» است. وقتی توسعه‌دهندگان سعی می‌کنند چندین مهارت را به طور همزمان به هوش مصنوعی آموزش دهند، پیشرفت در یک زمینه اغلب منجر به کاهش در زمینه دیگر می‌شود.

برای مثال، هرچه یک مدل از نظر ریاضی ماهرتر شود، توانایی‌های نوشتاری خلاقانه‌اش ممکن است به طور منفی تحت تأثیر قرار گیرد.

برای رسیدگی به این موضوع، بایدو یک فرآیند اصلاح چهار مرحله‌ای ایجاد کرد که آن را MOPD (تقطیر سیاست‌گذاری چند معلمه) می‌نامند.

0b5a83e4e4334df8a56ae72d29199bfdtplv-73owjymdk6-jj-mark-v1-0-0-0-0-5o6y6yer5oqa5pyv56s-5yy6ieagrwfzeuxmtq-q75.jpg — فرآیند آموزش چهار مرحله‌ای بایدو.

مرحله اول با آموزش تحت نظارت استاندارد روی یک مجموعه داده بزرگ آغاز می‌شود.

در مرحله دوم، بایدو چندین مدل متخصص جداگانه را به صورت موازی برای حوزه‌هایی مانند برنامه‌نویسی، استدلال منطقی و وظایف عامل آموزش می‌دهد که هر کدام سیگنال‌های ارزیابی خاص خود را دارند.

در مرحله سوم، یک مدل «دانش‌آموز» واحد، با تولید پاسخ‌های خود و مقایسه آنها با نتایج متخصصان، به طور همزمان از همه این «معلمان» متخصص یاد خواهد گرفت.

مرحله آخر شامل یادگیری تقویتی عمومی برای گفتگوهای آزاد و کارهای خلاقانه است.

به گفته‌ی بایدو، این مرحله‌ی نهایی بسیار مهم است، زیرا فرآیند خلاصه‌سازی از معلم به دانش‌آموز گاهی اوقات پاسخ‌هایی تولید می‌کند که بیش از حد شسته‌رفته هستند اما تنوع ندارند.

به لطف این فرآیند، ERNIE 5.1 به تعادلی در سطوح مهارت دست می‌یابد و از اولویت‌بندی بیش از حد یک حوزه و تحت الشعاع قرار گرفتن سایر حوزه‌ها جلوگیری می‌کند.

عملکرد پیشرو و جاه‌طلبی برای تسلط بر بازار جهانی.

تلاش‌های بهینه‌سازی بایدو نتایج ملموسی را در رتبه‌بندی‌های معتبر به همراه داشته است. در LMArena Search Arena، جایی که مدل‌های هوش مصنوعی توسط کاربران واقعی از طریق وظایف جستجوی وب زنده امتیازدهی می‌شوند، ERNIE 5.1 تا تاریخ 9 می به امتیاز 1223 دست یافت.

این امتیاز، آن را در جایگاه چهارم جهانی قرار می‌دهد و در بین تمام مدل‌های توسعه‌یافته در چین، رتبه برتر را دارد.

ernie-5-1-01-lmarena-search-ranking-1778639140714-1778639141083628747758-4531.jpg — ارنی ۵.۱ بلافاصله وارد ۴ رتبه برتر رتبه‌بندی LMArena شد.

در آزمون‌های فشرده دانش و استدلال، ERNIE 5.1 به عملکرد مدل‌های متن‌باز غربی پیشرو مانند Gemini 3.1 Pro گوگل نزدیک شد.

در مسابقه ریاضیات AIME26، این مدل هنگام استفاده از ابزارهای استدلال، به نرخ دقت ۹۹.۶٪ دست یافت و پس از Gemini 3.1 Pro در رتبه دوم قرار گرفت.

به طور خاص، در وظایفی که شامل «قابلیت‌های سازمانی» مانند پردازش صفحات گسترده پیچیده یا مرور خودکار چند مرحله‌ای وب بود، ERNIE 5.1 از DeepSeek-V4-Pro - مدلی که قبلاً رکورددار چین بود - عملکرد بهتری داشت.

داستان اثربخشی ERNIE 5.1 یادآور تأثیر DeepSeek R1 در اوایل سال 2025 است، زمانی که این استارتاپ نشان داد که می‌توان با 98 درصد هزینه کمتر، به عملکردی قابل مقایسه با OpenAI o1 دست یافت.

با این حال، در حالی که DeepSeek بر کارایی استدلال تمرکز دارد، ERNIE 5.1 از همان مرحله آموزش اولیه پیشرفت چشمگیری داشته است.

پیامی که بایدو ارسال می‌کند واضح است: آزمایشگاه‌های هوش مصنوعی چینی دائماً در حال یافتن راه‌های نوآورانه برای «انجام کارهای بیشتر با منابع کمتر» هستند، به جای اینکه صرفاً به تزریق قدرت سخت‌افزاری بیشتر به سیستم متکی باشند.

در حال حاضر، ERNIE 5.1 به طور گسترده در بیش از 10 پلتفرم و آژانس خلاق در چین مستقر شده است. کاربران می‌توانند این مدل را از طریق برنامه‌هایی مانند پلتفرم نقش‌آفرینی Isekai Zero، ابزار ساخت فیلم کوتاه Storymaster یا برنامه گرافیکی Diting Huanliu تجربه کنند.

‎‏‎ ...

رمزگشایی، رمزگشا

منبع: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html