ڈیپ سیک کا تختہ الٹ دیا گیا ہے۔

Qwen3، علی بابا کی طرف سے شروع کی گئی ایک نئی ٹیکنالوجی۔ تصویر: SCMP

تازہ ترین AI بینچ مارک ٹیسٹوں کے مطابق، علی بابا کے نئے جاری کردہ Qwen3 مصنوعی ذہانت کے ماڈل نے DeepSeek کے R1 کو پیچھے چھوڑ کر دنیا کا سب سے زیادہ درجہ بندی والا اوپن سورس ماڈل بن گیا ہے۔

خاص طور پر، LiveBench کا ڈیٹا، ایک آزاد پلیٹ فارم جو بڑے لینگویج ماڈلز (LLMs) کو اسکور کرتا ہے، ChatGPT جیسی جنریٹیو AI سروسز کے لیے بنیادی ٹیکنالوجی، یہ ظاہر کرتی ہے کہ Qwen3 نے ٹیسٹوں میں R1 کو پیچھے چھوڑ دیا ہے۔

اوپن سورس AI ماڈلز کی صلاحیتوں کے جائزے میں پروگرامنگ، ریاضی، ڈیٹا کا تجزیہ، اور زبان کی ہدایات شامل ہیں۔

علی بابا نے اپنی Qwen3 AI ماڈل سیریز 28 اپریل کو جاری کی۔ کمپنی کا دعویٰ ہے کہ یہ چیٹ بوٹ بعض صورتوں میں اوپن اے آئی یا گوگل کے بہترین موجودہ ماڈلز کا مقابلہ کر سکتا ہے، یا اس سے بھی آگے نکل سکتا ہے۔

235 بلین پیرامیٹرز کے سائز کے ساتھ، Qwen3 کی کارکردگی DeepSeek-V2 اور OpenAI GPT-4 کے مقابلے میں ہے، جس کے بالترتیب تقریباً 236 بلین اور 175 بلین پیرامیٹرز ہیں۔ ماڈلز کی اس سیریز کے جاری ہونے کے بعد صارفین جلد ہی اسے اے آئی ڈویلپمنٹ پلیٹ فارم ہگنگ فیس اور گیتھب پر اوپن لائسنس کے تحت ڈاؤن لوڈ کر سکیں گے۔

کمپنی نے بتایا کہ Qwen3 مجموعہ میں ہائبرڈ ماڈلز شامل ہیں، یعنی وہ پیچیدہ مسائل کو حل کرنے کے لیے استدلال کے لیے لچکدار طریقے سے وقت مختص کر سکتے ہیں یا آسان درخواستوں کا فوری جواب دے سکتے ہیں۔ اس ماڈل میں، استدلال کی صلاحیت معلومات کی درستگی کی خود تصدیق کرنے کی اجازت دیتی ہے، لیکن یہ ایک اہم وقت کے وقفے کے ساتھ آتا ہے۔

یہ ڈیزائن صارفین کے لیے ہر مخصوص کام کے لیے مناسب طریقے سے بجٹ مختص کرنا آسان بناتا ہے۔ مزید برآں، یہ ماڈل دنیا بھر کے بہت سے حریفوں سے بھی سیکھتا ہے۔

ڈیپ سیک کی طرح "ماہرین کا مرکب" (MoE) فن تعمیر کا استعمال کرتے ہوئے، Qwen3 تربیتی لاگت کا صرف ایک حصہ استعمال کرتے ہوئے کمپیوٹیشنل کارکردگی کو بہتر بنا سکتا ہے۔ یہ طریقہ کاموں کو کئی الگ الگ حصوں میں تقسیم کرتا ہے اور انہیں انجام دینے کے لیے صرف کافی مقدار میں ڈیٹا کی ضرورت ہوتی ہے۔

ترقیاتی ٹیم کے مطابق، Qwen3 119 زبانوں کو سپورٹ کرتا ہے اور اسے تقریباً 36 ٹریلین ٹوکنز کے ڈیٹا سیٹ پر تربیت دی جاتی ہے، جو کہ 27 ٹریلین الفاظ کے برابر ہے۔ تربیتی ڈیٹا مختلف ذرائع سے حاصل کیا جاتا ہے جیسے کہ نصابی کتابیں، سوال جواب سیٹ، پروگرامنگ کوڈ، یا یہاں تک کہ AI سے تیار کردہ ڈیٹا وغیرہ۔

اوپن سورس رینکنگ میں سرفہرست ہونے کے باوجود، LiveBench کے توسیع شدہ بینچ مارک ٹیسٹ سے پتہ چلتا ہے کہ Qwen3 اب بھی دنیا کے معروف بند سورس AI ماڈلز سے پیچھے ہے۔ ان میں سب سے نمایاں ہیں OpenAI کا o3، گوگل کا Gemini Pro 2.5، اور Anthropic کا Claude 3.7۔

فی الحال، مائیکروسافٹ کے ذریعے تعاون یافتہ جدید ترین اوپن اے آئی ماڈل، o3-mini ہائی، دنیا بھر میں AI ماڈلز کی مجموعی درجہ بندی میں سرفہرست ہے۔

ماخذ: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html