Vietnam.vn - Nền tảng quảng bá Việt Nam

نئی تحقیق ڈیپ سیک کی کامیابی کا راز بتاتی ہے۔

DeepSeek کے مطابق، R1 مصنوعی ذہانت کے ماڈل کو OpenAI کے ماڈل کے ڈیٹا کا استعمال کرتے ہوئے تربیت نہیں دی گئی، حالانکہ اس نے تسلیم کیا کہ بیس ماڈل کو ویب ڈیٹا پر تربیت دی گئی تھی - جس میں AI سے تیار کردہ مواد شامل ہو سکتا ہے۔

VietnamPlusVietnamPlus17/09/2025

چینی سٹارٹ اپ DeepSeek کا R1 مصنوعی ذہانت کا ماڈل – جس نے جنوری میں لانچ ہونے پر امریکی اسٹاک مارکیٹ کو چونکا دیا تھا – پہلے ہم مرتبہ جائزہ شدہ مطالعہ میں شائع کیا گیا ہے، جس میں یہ دکھایا گیا ہے کہ اس نے صرف $300,000 میں ایک طاقتور LLM کیسے تیار کیا۔

R1 کو ریاضی اور پروگرامنگ جیسے استدلال کے کاموں میں سبقت حاصل کرنے کے لیے ڈیزائن کیا گیا ہے، جس سے یہ امریکی ٹیک جنات کے تیار کردہ ٹولز کا کم لاگت کا حریف ہے۔

یہ ایک "اوپن ویٹ" ماڈل ہے، جو ڈاؤن لوڈ کرنے کے لیے مفت ہے اور فی الحال ہگنگ فیس پلیٹ فارم پر 10.9 ملین سے زیادہ ڈاؤن لوڈز کے ساتھ مقبول ترین ماڈل ہے۔

نیچر اسٹڈی، جنوری کے ایک مخطوطے کی ایک تازہ کاری، نے سب سے پہلے انکشاف کیا کہ R1 کی تربیت پر صرف $294,000 لاگت آئی، اس کے علاوہ بیس ماڈل کی تعمیر پر تقریباً 6 ملین ڈالر خرچ ہوئے۔

یہ تعداد ان دسیوں ملین ڈالرز سے بہت کم ہے جن کے بارے میں کہا جاتا ہے کہ حریفوں نے خرچ کیا ہے۔

ڈیپ سیک نے کہا کہ R1 کو بنیادی طور پر Nvidia H800 چپس استعمال کرنے کی تربیت دی گئی تھی، جسے امریکہ نے 2023 سے چین کو برآمد کرنے پر پابندی عائد کر رکھی ہے۔

R1 کی پیش رفت اس کا "خالص کمک سیکھنے" کا استعمال تھا، جہاں ماڈل کو آزمائش اور غلطی پر تربیت دی جاتی ہے اور انسانوں کی منتخب کردہ مثالوں سے سیکھنے کے بجائے درست جوابات کے لیے انعام دیا جاتا ہے۔ یہ اندرونی تخمینوں کا استعمال کرتے ہوئے اپنی کوششیں بھی اسکور کرتا ہے، ایک تکنیک جسے "رشتہ دار گروپ پالیسی آپٹیمائزیشن" کہا جاتا ہے، جو کارکردگی کو بڑھانے میں مدد کرتی ہے۔

محقق ہوان سن (اوہائیو اسٹیٹ یونیورسٹی) کا کہنا ہے کہ "سخت ہم مرتبہ کے جائزے کا عمل ماڈل کی قدر اور اعتبار کو درست کرنے میں مدد کرتا ہے۔" "دوسری فرموں کو بھی ایسا ہی کرنا چاہیے۔"

Hugging Face کے ایک مشین لرننگ انجینئر، Lewis Tunstall نے کہا کہ یہ ایک اہم نظیر ہے کیونکہ AI کی ترقی میں شفافیت سے خطرات کا زیادہ درست اندازہ لگانے میں مدد ملتی ہے۔

ڈیپ سیک کا دعویٰ ہے کہ R1 کو OpenAI کے ماڈلز کے ڈیٹا کا استعمال کرتے ہوئے تربیت نہیں دی گئی تھی، حالانکہ یہ تسلیم کرتا ہے کہ بنیادی ماڈل کو ویب ڈیٹا پر تربیت دی گئی تھی - جس میں AI سے تیار کردہ مواد شامل ہو سکتا ہے۔

ماہرین کا کہنا ہے کہ اگرچہ اس کی مکمل تصدیق کرنا مشکل ہے، لیکن موجودہ شواہد بتاتے ہیں کہ اعلیٰ کارکردگی کے حصول کے لیے خالص اضافہ کافی ہے۔

ScienceAgentBench ٹیسٹ پر، R1 درستگی کے چارٹ میں سرفہرست نہیں تھا، لیکن اس نے کارکردگی اور لاگت کے درمیان اچھا توازن قائم کیا۔ محققین اب موجودہ LLMs کی استدلال کی صلاحیتوں کو بڑھانے کے ساتھ ساتھ اسے ریاضی اور پروگرامنگ سے باہر کے شعبوں تک بڑھانے کے لیے DeepSeek کے طریقہ کار کو لاگو کرنے کی کوشش کر رہے ہیں۔

مسٹر ٹنسٹال کے مطابق، R1 نے مصنوعی ذہانت کی ترقی میں "ایک انقلاب شروع کر دیا ہے"۔

(TTXVN/Vietnam+)

ماخذ: https://www.vietnamplus.vn/nghien-cuu-moi-tiet-lo-bi-quyet-thanh-cong-cua-deepseek-post1062474.vnp


تبصرہ (0)

No data
No data

اسی موضوع میں

اسی زمرے میں

ہیرو آف لیبر تھائی ہوانگ کو کریملن میں روسی صدر ولادیمیر پوتن نے براہ راست فرینڈشپ میڈل سے نوازا۔
Phu Sa Phin کو فتح کرنے کے راستے میں پری کائی کے جنگل میں کھو گیا۔
آج صبح، Quy Nhon ساحلی شہر دھند میں 'خواب بھرا' ہے۔
'کلاؤڈ ہنٹنگ' سیزن میں ساپا کی دلکش خوبصورتی

اسی مصنف کی

ورثہ

پیکر

کاروبار

آج صبح، Quy Nhon ساحلی شہر دھند میں 'خواب بھرا' ہے۔

موجودہ واقعات

سیاسی نظام

مقامی

پروڈکٹ