Vietnam.vn - Nền tảng quảng bá Việt Nam

ڈیپ سیک اپنے رازوں سے پردہ اٹھاتی ہے۔

ڈیپ سیک نے پہلی بار انکشاف کیا ہے کہ اس نے بیک وقت ہارڈ ویئر اور سافٹ ویئر ڈیزائن کی بدولت کم قیمت پر دنیا کا معروف اوپن سورس AI ماڈل کیسے بنایا۔

ZNewsZNews19/05/2025

ڈیپ سیک بتاتا ہے کہ وہ کس طرح کم لاگت والے AI ماڈلز بناتے ہیں۔ تصویر: بلومبرگ ۔

15 مئی کو شائع ہونے والی ایک تحقیقی رپورٹ میں، DeepSeek نے پہلی بار تفصیلات شیئر کیں کہ اس نے اپنے حریفوں کی لاگت کے ایک حصے پر دنیا کے سب سے طاقتور اوپن سورس AI سسٹمز میں سے ایک کیسے بنایا۔

مطالعہ، جس کا عنوان ہے "Insights into DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures"، بانی لیانگ وینفینگ کے ساتھ شریک تصنیف ہے۔ DeepSeek اپنی کامیابی کا سہرا ہارڈ ویئر اور سافٹ ویئر کے متوازی ڈیزائن کو دیتا ہے، جو کہ بہت سی کمپنیوں کے مقابلے میں ایک مختلف نقطہ نظر ہے جو اب بھی آزادانہ طور پر سافٹ ویئر کو بہتر بنانے پر توجہ مرکوز کرتی ہے۔

"DeepSeek-V3، جو 2,048 Nvidia H800 GPUs پر تربیت یافتہ ہے، نے یہ ظاہر کیا کہ متوازی ڈیزائن کس طرح مؤثر طریقے سے چیلنجوں کو حل کر سکتا ہے، موثر تربیت اور پیمانے پر اندازہ لگانے کے قابل بناتا ہے،" تحقیقی ٹیم نے رپورٹ میں لکھا۔ ڈیپ سیک اور ہیج فنڈ ہائی فلائر نے 2023 میں امریکہ کی طرف سے چین کو برآمد کرنے پر پابندی عائد کرنے سے پہلے H800 چپس کو ذخیرہ کر لیا تھا۔

مضمون کے مطابق، ڈیپ سیک ریسرچ ٹیم ہارڈ ویئر کی حدود اور بڑے لینگویج ماڈلز (LLMs) کی تربیت کے بے حد اخراجات سے بخوبی واقف تھی، جو OpenAI کے ChatGPT جیسے چیٹ بوٹس کے پیچھے بنیادی ٹیکنالوجی ہے۔ لہذا، انہوں نے میموری کی کارکردگی کو بڑھانے، چپس کے درمیان رابطے کو بہتر بنانے، اور AI انفراسٹرکچر کی مجموعی کارکردگی کو بڑھانے کے لیے تکنیکی اصلاح کا ایک سلسلہ نافذ کیا۔

مزید برآں، ڈیپ سیک مکسڈ ایکسپرٹ ماڈل (MoE) فن تعمیر کے کردار پر زور دیتا ہے۔ یہ مشین لرننگ کا ایک طریقہ ہے جو AI ماڈل کو سب نیٹ ورکس میں تقسیم کرتا ہے، ہر ایک ان پٹ ڈیٹا کے الگ حصے پر کارروائی کرتا ہے اور نتائج کو بہتر بنانے کے لیے باہمی تعاون سے کام کرتا ہے۔

MoE تربیت کے اخراجات کو کم کرنے اور استدلال کی رفتار کو تیز کرنے میں مدد کرتا ہے۔ یہ طریقہ اب چینی ٹیک انڈسٹری میں وسیع پیمانے پر اپنایا جاتا ہے، بشمول علی بابا کا جدید ترین Qwen3 ماڈل۔

DeepSeek نے سب سے پہلے توجہ حاصل کی جب اس نے دسمبر 2024 میں اپنا بنیادی V3 ماڈل اور جنوری میں اس کا R1 ریجننگ ماڈل جاری کیا۔ ان مصنوعات نے عالمی مارکیٹ میں ہلچل مچا دی، جس سے AI سے متعلقہ ٹیکنالوجی اسٹاک میں بڑے پیمانے پر کمی واقع ہوئی۔

اگرچہ ڈیپ سیک نے حال ہی میں مزید کسی منصوبے کا انکشاف نہیں کیا ہے، لیکن اس نے باقاعدہ رپورٹس کے ذریعے کمیونٹی کی دلچسپی کو برقرار رکھا ہے۔ مارچ کے آخر میں، کمپنی نے DeepSeek-V3 کو ایک معمولی اپ ڈیٹ جاری کیا، اور اپریل کے آخر تک، انہوں نے خاموشی سے پروور-V2 سسٹم کو ریاضیاتی ثبوت پروسیسنگ کے لیے شروع کیا۔

ماخذ: https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html


تبصرہ (0)

برائے مہربانی اپنی جذبات کا اظہار کرنے کے لیے تبصرہ کریں!

اسی زمرے میں

اسی مصنف کی

ورثہ

پیکر

کاروبار

کرنٹ افیئرز

سیاسی نظام

مقامی

پروڈکٹ

Happy Vietnam
مکرم

مکرم

قدیم دارالحکومت میں Ao Dai

قدیم دارالحکومت میں Ao Dai

ویتنام کی سب سے خوبصورت سڑک

ویتنام کی سب سے خوبصورت سڑک