در بحبوحه رقابت جهانی هوش مصنوعی که میلیاردها دلار برای قدرت محاسباتی هزینه میکند، بایدو که اغلب به عنوان "گوگل چین" شناخته میشود، با راهاندازی رسمی مدل زبان بزرگ ERNIE 5.1 خود، شوک بزرگی ایجاد کرده است.
برجستهترین جنبه نه تنها در قابلیتهای پردازش برتر آن، بلکه در ارزش اقتصادی چشمگیر آن نیز نهفته است: هزینه آموزش این مدل تقریباً ۹۴٪ کمتر از سیستمهای هوش مصنوعی در مقیاس مشابه است. این به عنوان یک راه حل جدید برای مشکل بهینهسازی منابع در نسل بعدی هوش مصنوعی دیده میشود.

فناوری فشردهسازی شبکه و استراتژی «یک بار آموزش، همه را آموزش بده»
برای درک اینکه چرا بایدو توانست هزینهها را تا چنین حد باورنکردنی کاهش دهد، باید به نحوه ساخت ERNIE 5.1 توسط آنها نگاه کرد.
بایدو به جای دنبال کردن مسیر سنتی آموزش یک مدل کاملاً جدید از ابتدا، یک روش «پیشآموزش الاستیک چندبعدی» را اتخاذ کرد. به طور خاص، ERNIE 5.1 یک نهاد کاملاً مستقل نیست، بلکه بر اساس پایههای نسخه قبلی خود، ERNIE 5.0 (که در ژانویه 2026 عرضه شد) توسعه یافته است.
بایدو از یک چارچوب آموزشی انعطافپذیر به نام «یکبار برای همیشه» استفاده کرده است. این شرکت به جای اجرای آموزشهای جداگانه و پرهزینه برای هر اندازه مدل مختلف، یک «خانواده» کامل از مدلها با اندازههای مختلف را در یک اجرا بهینه میکند.

این مدلها وزنهای مشترکی دارند اما از نظر عمق، وسعت و تعداد بلوکهای خبره فعالشده متفاوت هستند. بایدو از معماری عظیم ERNIE 5.0 با تقریباً ۲.۴ تریلیون پارامتر، یک زیرشبکه بهینهشده برای ایجاد ERNIE 5.1 استخراج کرد.
نتیجه، یک مدل سادهسازیشده است که تعداد کل پارامترها تنها حدود یکسوم مدل اصلی است. بهویژه، تعداد پارامترهای عملیاتی، یعنی آن بخشهایی که در واقع در پردازش بازخورد در یک مکالمه شرکت میکنند، به نصف کاهش یافته است.
به ارث بردن پایگاه دانش گسترده از مدل «والد» خود بدون تکرار کل فرآیند آموزش پرهزینه، کلید صرفهجویی تا ۹۴ درصد از بودجه بایدو است.
علاوه بر این، بایدو سیستم یادگیری تقویتی خود را به طور کامل بازسازی کرد. به جای پیوند دادن سفت و سخت بهروزرسانیهای مدل، تولید بازخورد و ارزیابی اجرا، آنها را به زیرسیستمهای مستقلی تقسیم کردند که توسط یک واحد کنترل مرکزی هماهنگ میشوند.
این امر به هر جزء اجازه میدهد تا روی مناسبترین سختافزار اجرا شود و تضمین میکند که گلوگاه در یک مرحله، کل فرآیند را کند نمیکند.
برای رفع مشکل سوگیری محاسباتی در مدلهای ترکیبی از متخصصان (MoE)، بایدو همچنین یک کتابخانه محاسباتی استاندارد با دقت پایین پیادهسازی کرد که بیثباتی را بدون کاهش سرعت پردازش به نصف کاهش داد.
با یک فرآیند آموزشی چهار مرحلهای، به «اثر الاکلنگی» بپردازید.
یک چالش ذاتی در آموزش مدلهای بزرگ هوش مصنوعی، «اثر الاکلنگی» است. وقتی توسعهدهندگان سعی میکنند چندین مهارت را به طور همزمان به هوش مصنوعی آموزش دهند، پیشرفت در یک زمینه اغلب منجر به کاهش در زمینه دیگر میشود.
برای مثال، هرچه یک مدل از نظر ریاضی ماهرتر شود، تواناییهای نوشتاری خلاقانهاش ممکن است به طور منفی تحت تأثیر قرار گیرد.
برای رسیدگی به این موضوع، بایدو یک فرآیند اصلاح چهار مرحلهای ایجاد کرد که آن را MOPD (تقطیر سیاستگذاری چند معلمه) مینامند.

مرحله اول با آموزش تحت نظارت استاندارد روی یک مجموعه داده بزرگ آغاز میشود.
در مرحله دوم، بایدو چندین مدل متخصص جداگانه را به صورت موازی برای حوزههایی مانند برنامهنویسی، استدلال منطقی و وظایف عامل آموزش میدهد که هر کدام سیگنالهای ارزیابی خاص خود را دارند.
در مرحله سوم، یک مدل «دانشآموز» واحد، با تولید پاسخهای خود و مقایسه آنها با نتایج متخصصان، به طور همزمان از همه این «معلمان» متخصص یاد خواهد گرفت.
مرحله آخر شامل یادگیری تقویتی عمومی برای گفتگوهای آزاد و کارهای خلاقانه است.
به گفتهی بایدو، این مرحلهی نهایی بسیار مهم است، زیرا فرآیند خلاصهسازی از معلم به دانشآموز گاهی اوقات پاسخهایی تولید میکند که بیش از حد شستهرفته هستند اما تنوع ندارند.
به لطف این فرآیند، ERNIE 5.1 به تعادلی در سطوح مهارت دست مییابد و از اولویتبندی بیش از حد یک حوزه و تحت الشعاع قرار گرفتن سایر حوزهها جلوگیری میکند.
عملکرد پیشرو و جاهطلبی برای تسلط بر بازار جهانی.
تلاشهای بهینهسازی بایدو نتایج ملموسی را در رتبهبندیهای معتبر به همراه داشته است. در LMArena Search Arena، جایی که مدلهای هوش مصنوعی توسط کاربران واقعی از طریق وظایف جستجوی وب زنده امتیازدهی میشوند، ERNIE 5.1 تا تاریخ 9 می به امتیاز 1223 دست یافت.
این امتیاز، آن را در جایگاه چهارم جهانی قرار میدهد و در بین تمام مدلهای توسعهیافته در چین، رتبه برتر را دارد.

در آزمونهای فشرده دانش و استدلال، ERNIE 5.1 به عملکرد مدلهای متنباز غربی پیشرو مانند Gemini 3.1 Pro گوگل نزدیک شد.
در مسابقه ریاضیات AIME26، این مدل هنگام استفاده از ابزارهای استدلال، به نرخ دقت ۹۹.۶٪ دست یافت و پس از Gemini 3.1 Pro در رتبه دوم قرار گرفت.
به طور خاص، در وظایفی که شامل «قابلیتهای سازمانی» مانند پردازش صفحات گسترده پیچیده یا مرور خودکار چند مرحلهای وب بود، ERNIE 5.1 از DeepSeek-V4-Pro - مدلی که قبلاً رکورددار چین بود - عملکرد بهتری داشت.
داستان اثربخشی ERNIE 5.1 یادآور تأثیر DeepSeek R1 در اوایل سال 2025 است، زمانی که این استارتاپ نشان داد که میتوان با 98 درصد هزینه کمتر، به عملکردی قابل مقایسه با OpenAI o1 دست یافت.
با این حال، در حالی که DeepSeek بر کارایی استدلال تمرکز دارد، ERNIE 5.1 از همان مرحله آموزش اولیه پیشرفت چشمگیری داشته است.
پیامی که بایدو ارسال میکند واضح است: آزمایشگاههای هوش مصنوعی چینی دائماً در حال یافتن راههای نوآورانه برای «انجام کارهای بیشتر با منابع کمتر» هستند، به جای اینکه صرفاً به تزریق قدرت سختافزاری بیشتر به سیستم متکی باشند.
در حال حاضر، ERNIE 5.1 به طور گسترده در بیش از 10 پلتفرم و آژانس خلاق در چین مستقر شده است. کاربران میتوانند این مدل را از طریق برنامههایی مانند پلتفرم نقشآفرینی Isekai Zero، ابزار ساخت فیلم کوتاه Storymaster یا برنامه گرافیکی Diting Huanliu تجربه کنند.
...
منبع: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html









نظر (0)