ایک عالمی مصنوعی ذہانت کی دوڑ کے درمیان جو کمپیوٹنگ پاور پر اربوں ڈالر خرچ کر رہی ہے، Baidu، جسے اکثر "China's Google" کہا جاتا ہے، نے اپنے ERNIE 5.1 بڑے لینگویج ماڈل کو باضابطہ طور پر لانچ کر کے ایک بڑا جھٹکا لگا دیا ہے۔
سب سے نمایاں پہلو نہ صرف اس کی اعلیٰ پروسیسنگ صلاحیتوں میں ہے بلکہ اس کی متاثر کن اقتصادی قدر میں بھی ہے: اس ماڈل کی تربیت کی لاگت اسی پیمانے کے AI سسٹمز کے مقابلے تقریباً 94% کم ہے۔ اسے AI کی اگلی نسل میں وسائل کو بہتر بنانے کے مسئلے کے ایک نئے حل کے طور پر دیکھا جاتا ہے۔

نیٹ ورک کمپریشن ٹیکنالوجی اور "ایک بار ٹرین، سب کو ٹرین" کی حکمت عملی۔
یہ سمجھنے کے لیے کہ Baidu اس قدر ناقابل یقین حد تک لاگت میں کمی کیوں کر سکتا ہے، یہ دیکھنے کی ضرورت ہے کہ انھوں نے ERNIE 5.1 کیسے بنایا۔
شروع سے بالکل نئے ماڈل کی تربیت کے روایتی راستے پر چلنے کے بجائے، Baidu نے "کثیر جہتی لچکدار پری ٹریننگ" کا طریقہ اپنایا۔ خاص طور پر، ERNIE 5.1 مکمل طور پر خودمختار ادارہ نہیں ہے لیکن اسے اپنے پیشرو، ERNIE 5.0 (جنوری 2026 میں لانچ کیا گیا) کی بنیاد پر تیار کیا گیا ہے۔
Baidu نے ایک لچکدار تربیتی فریم ورک استعمال کیا ہے جسے "ایک بار سب کے لیے" کہا جاتا ہے۔ ہر ایک مختلف ماڈل سائز کے لیے الگ الگ اور مہنگی ٹریننگ چلانے کے بجائے، کمپنی ایک ہی رن میں مختلف سائز کے ماڈلز کے پورے "خاندان" کو بہتر بناتی ہے۔

یہ ماڈل وزن کا اشتراک کرتے ہیں لیکن گہرائی، چوڑائی اور فعال ماہر بلاکس کی تعداد میں مختلف ہوتے ہیں۔ تقریباً 2.4 ٹریلین پیرامیٹرز کے ساتھ ERNIE 5.0 کے بڑے فن تعمیر سے، Baidu نے ERNIE 5.1 بنانے کے لیے ایک بہترین سب نیٹ نکالا۔
نتیجہ ایک ہموار ماڈل ہے جس میں پیرامیٹرز کی کل تعداد اصل کا صرف ایک تہائی ہے۔ خاص طور پر، آپریشنل پیرامیٹرز کی تعداد، یعنی وہ حصے جو بات چیت میں فیڈ بیک کی پروسیسنگ میں حصہ لیتے ہیں، نصف کر دیے گئے ہیں۔
پورے مہنگے تربیتی عمل کو دہرائے بغیر اپنے "والدین" ماڈل سے وسیع علمی بنیاد کو وراثت میں لینا Baidu کے بجٹ کا 94% تک بچانے کی کلید ہے۔
اس کے علاوہ، Baidu نے اپنے کمک سیکھنے کے نظام کو مکمل طور پر از سر نو تشکیل دیا۔ ماڈل اپ ڈیٹس، فیڈ بیک جنریشن، اور رن ایویلیویشن کو سختی سے جوڑنے کے بجائے، انہوں نے انہیں آزاد سب سسٹمز میں الگ کر دیا، جو ایک مرکزی کنٹرول یونٹ کے ذریعے مربوط ہیں۔
یہ ہر ایک جزو کو انتہائی موزوں ہارڈ ویئر پر چلانے کی اجازت دیتا ہے، اس بات کو یقینی بناتا ہے کہ ایک قدم پر رکاوٹ پورے عمل کو سست نہیں کرے گی۔
مکسڈ ایکسپرٹ (MoE) ماڈلز میں کمپیوٹیشنل تعصب کے مسئلے کو حل کرنے کے لیے، Baidu نے ایک معیاری کم درستگی والی کمپیوٹیشن لائبریری بھی نافذ کی، جس نے پروسیسنگ کی رفتار کو کم کیے بغیر عدم استحکام کو آدھا کر دیا۔
چار مراحل کے تربیتی عمل کے ساتھ "سیسو اثر" کو ایڈریس کریں۔
بڑے AI ماڈلز کو تربیت دینے میں ایک موروثی چیلنج "سیسو اثر" ہے۔ جب ڈویلپرز بیک وقت AI متعدد مہارتیں سکھانے کی کوشش کرتے ہیں، تو ایک شعبے میں بہتری اکثر دوسرے میں کمی کا باعث بنتی ہے۔
مثال کے طور پر، جیسا کہ ایک ماڈل ریاضیاتی طور پر زیادہ ماہر ہوتا ہے، اس کی تخلیقی تحریری صلاحیتوں پر منفی اثر پڑ سکتا ہے۔
اس سے نمٹنے کے لیے، Baidu نے ایک چار مراحل پر مشتمل ریفائنمنٹ کا عمل قائم کیا جسے MOPD (ملٹی ٹیچر آن پالیسی ڈسٹلیشن) کہتے ہیں۔

پہلا مرحلہ ایک بڑے ڈیٹاسیٹ پر معیاری زیر نگرانی تربیت کے ساتھ شروع ہوتا ہے۔
دوسرے مرحلے میں، Baidu متعدد الگ الگ ماہر ماڈلز کو متوازی طور پر تربیت دیتا ہے جیسے کہ پروگرامنگ، منطقی استدلال، اور ایجنٹ کے کاموں کے لیے، جن میں سے ہر ایک کے اپنے تشخیصی اشارے ہیں۔
تیسرے مرحلے میں، ایک واحد "طالب علم" ماڈل ان تمام ماہر "اساتذہ" سے اپنے جوابات تیار کرکے اور ماہرین کے نتائج سے ان کا موازنہ کرکے بیک وقت سیکھے گا۔
آخری مرحلے میں کھلے مکالموں اور تخلیقی کاموں کے لیے عمومی کمک سیکھنا شامل ہے۔
Baidu کے مطابق، یہ آخری مرحلہ بہت اہم ہے کیونکہ استاد سے طالب علم تک کشید کرنے کا عمل بعض اوقات ایسے جوابات پیدا کرتا ہے جو حد سے زیادہ چمکدار ہوتے ہیں لیکن تنوع کی کمی ہوتی ہے۔
اس عمل کی بدولت، ERNIE 5.1 مہارت کی سطحوں میں توازن حاصل کرتا ہے، جس سے کسی ایک شعبے کو زیادہ ترجیح دینے اور دوسرے کو زیر کرنے سے روکتا ہے۔
نمایاں کارکردگی اور عالمی مارکیٹ پر غلبہ حاصل کرنے کی خواہش۔
Baidu کی اصلاح کی کوششوں نے معروف درجہ بندیوں پر ٹھوس نتائج حاصل کیے ہیں۔ LMArena Search Arena پر، جہاں AI ماڈلز حقیقی صارفین کے ذریعے لائیو ویب سرچ ٹاسک کے ذریعے اسکور کیے جاتے ہیں، ERNIE 5.1 نے 9 مئی تک 1,223 کا اسکور حاصل کیا۔
یہ اسکور اسے عالمی سطح پر چوتھی پوزیشن پر رکھتا ہے اور چین میں تیار کردہ تمام ماڈلز میں سب سے اوپر ہے۔

علم اور استدلال کے گہرے امتحانات میں، ERNIE 5.1 نے معروف مغربی کلوز سورس ماڈلز جیسے کہ Google کے Gemini 3.1 Pro کی کارکردگی کو دیکھا۔
AIME26 ریاضی کے مقابلے میں، اس ماڈل نے استدلال کے اوزار استعمال کرتے ہوئے 99.6% درستگی کی شرح حاصل کی، جو کہ Gemini 3.1 Pro کے بعد دوسرے نمبر پر ہے۔
خاص طور پر، پیچیدہ اسپریڈ شیٹس پر کارروائی کرنے یا خودکار ملٹی سٹیپ ویب براؤزنگ جیسے کاموں میں "ایجنسی کی صلاحیتیں" شامل ہیں، ERNIE 5.1 نے DeepSeek-V4-Pro کو پیچھے چھوڑ دیا – وہ ماڈل جس نے پہلے چین میں ریکارڈ رکھا تھا۔
ERNIE 5.1 کی تاثیر کی کہانی 2025 کے اوائل میں DeepSeek R1 کے اثرات کی یاد دلاتی ہے، جب سٹارٹ اپ نے یہ ظاہر کیا کہ OpenAI o1 کے مقابلے میں 98% کم لاگت پر کارکردگی حاصل کرنا ممکن ہے۔
تاہم، جبکہ ڈیپ سیک استدلال کی کارکردگی پر توجہ مرکوز کرتا ہے، ERNIE 5.1 ابتدائی تربیتی مرحلے سے ہی ایک پیش رفت کرتا ہے۔
Baidu جو پیغام بھیج رہا ہے وہ واضح ہے: چینی AI لیبز سسٹم میں زیادہ ہارڈ ویئر پاور ڈالنے پر انحصار کرنے کے بجائے "کم کے ساتھ زیادہ کرنے" کے لیے مسلسل جدید طریقے تلاش کر رہی ہیں۔
فی الحال، ERNIE 5.1 نے چین میں 10 سے زیادہ تخلیقی پلیٹ فارمز اور ایجنسیوں میں وسیع پیمانے پر تعیناتی شروع کر دی ہے۔ صارفین اس ماڈل کو ایپلیکیشنز کے ذریعے تجربہ کر سکتے ہیں جیسے کہ رول پلےنگ پلیٹ فارم Isekai Zero، مختصر فلم تخلیق کرنے والا ٹول Storymaster، یا گرافکس ایپلی کیشن Diting Huanliu۔
میں
ماخذ: https://khoahocdoisong.vn/quai-vat-ai-ernie-51-cua-baidu-van-hanh-with-lower-cost-than-94-post2149100260.html







تبصرہ (0)