نئی تحقیق ڈیپ سیک کی کامیابی کا راز بتاتی ہے۔

چینی سٹارٹ اپ DeepSeek کا R1 مصنوعی ذہانت کا ماڈل – جس نے جنوری میں لانچ ہونے پر امریکی اسٹاک مارکیٹ کو چونکا دیا تھا – پہلے ہم مرتبہ جائزہ شدہ مطالعہ میں شائع کیا گیا ہے، جس میں یہ دکھایا گیا ہے کہ اس نے صرف $300,000 میں ایک طاقتور LLM کیسے تیار کیا۔

R1 کو ریاضی اور پروگرامنگ جیسے استدلال کے کاموں میں سبقت حاصل کرنے کے لیے ڈیزائن کیا گیا ہے، جس سے یہ امریکی ٹیک جنات کے تیار کردہ ٹولز کا کم لاگت کا حریف ہے۔

یہ ایک "اوپن ویٹ" ماڈل ہے، جو ڈاؤن لوڈ کرنے کے لیے مفت ہے اور فی الحال ہگنگ فیس پلیٹ فارم پر 10.9 ملین سے زیادہ ڈاؤن لوڈز کے ساتھ مقبول ترین ماڈل ہے۔

نیچر اسٹڈی، جنوری کے ایک مخطوطے کی ایک تازہ کاری، نے سب سے پہلے انکشاف کیا کہ R1 کی تربیت پر صرف $294,000 لاگت آئی، اس کے علاوہ بیس ماڈل کی تعمیر پر تقریباً 6 ملین ڈالر خرچ ہوئے۔

یہ تعداد ان دسیوں ملین ڈالرز سے بہت کم ہے جن کے بارے میں کہا جاتا ہے کہ حریفوں نے خرچ کیا ہے۔

ڈیپ سیک نے کہا کہ R1 کو بنیادی طور پر Nvidia H800 چپس استعمال کرنے کی تربیت دی گئی تھی، جسے امریکہ نے 2023 سے چین کو برآمد کرنے پر پابندی عائد کر رکھی ہے۔

R1 کی پیش رفت اس کا "خالص کمک سیکھنے" کا استعمال تھا، جہاں ماڈل کو آزمائش اور غلطی پر تربیت دی جاتی ہے اور انسانوں کی منتخب کردہ مثالوں سے سیکھنے کے بجائے درست جوابات کے لیے انعام دیا جاتا ہے۔ یہ اندرونی تخمینوں کا استعمال کرتے ہوئے اپنی کوششیں بھی اسکور کرتا ہے، ایک تکنیک جسے "رشتہ دار گروپ پالیسی آپٹیمائزیشن" کہا جاتا ہے، جو کارکردگی کو بڑھانے میں مدد کرتی ہے۔

محقق ہوان سن (اوہائیو اسٹیٹ یونیورسٹی) کا کہنا ہے کہ "سخت ہم مرتبہ کے جائزے کا عمل ماڈل کی قدر اور اعتبار کو درست کرنے میں مدد کرتا ہے۔" "دوسری فرموں کو بھی ایسا ہی کرنا چاہیے۔"

Hugging Face کے ایک مشین لرننگ انجینئر، Lewis Tunstall نے کہا کہ یہ ایک اہم نظیر ہے کیونکہ AI کی ترقی میں شفافیت سے خطرات کا زیادہ درست اندازہ لگانے میں مدد ملتی ہے۔

ڈیپ سیک کا دعویٰ ہے کہ R1 کو OpenAI کے ماڈلز کے ڈیٹا کا استعمال کرتے ہوئے تربیت نہیں دی گئی تھی، حالانکہ یہ تسلیم کرتا ہے کہ بنیادی ماڈل کو ویب ڈیٹا پر تربیت دی گئی تھی - جس میں AI سے تیار کردہ مواد شامل ہو سکتا ہے۔

ماہرین کا کہنا ہے کہ اگرچہ اس کی مکمل تصدیق کرنا مشکل ہے، لیکن موجودہ شواہد بتاتے ہیں کہ اعلیٰ کارکردگی کے حصول کے لیے خالص اضافہ کافی ہے۔

ScienceAgentBench ٹیسٹ پر، R1 درستگی کے چارٹ میں سرفہرست نہیں تھا، لیکن اس نے کارکردگی اور لاگت کے درمیان اچھا توازن قائم کیا۔ محققین اب موجودہ LLMs کی استدلال کی صلاحیتوں کو بڑھانے کے ساتھ ساتھ اسے ریاضی اور پروگرامنگ سے باہر کے شعبوں تک بڑھانے کے لیے DeepSeek کے طریقہ کار کو لاگو کرنے کی کوشش کر رہے ہیں۔

مسٹر ٹنسٹال کے مطابق، R1 نے مصنوعی ذہانت کی ترقی میں "ایک انقلاب شروع کر دیا ہے"۔

(TTXVN/Vietnam+)

ماخذ: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp