Qwen3، علی بابا کی طرف سے شروع کی گئی ایک نئی ٹیکنالوجی۔ تصویر: SCMP |
اے آئی ورلڈ کے تازہ ترین بینچ مارک ٹیسٹوں کے مطابق، علی بابا کے نئے جاری کردہ مصنوعی ذہانت کے ماڈل Qwen3 نے DeepSeek کے R1 کو پیچھے چھوڑ کر دنیا کا سب سے اونچا اوپن سورس ماڈل بن گیا ہے۔
خاص طور پر، LiveBench کا ڈیٹا، ایک آزاد پلیٹ فارم جو بڑے لینگویج ماڈلز (LLMs) کو بینچ مارک کرتا ہے، وہ ٹیکنالوجی جو ChatGPT جیسی جنریٹیو AI سروسز کو کم کرتی ہے، یہ ظاہر کرتی ہے کہ Qwen3 نے ٹیسٹوں میں R1 کو پیچھے چھوڑ دیا۔
اوپن سورس AI ماڈلز کی صلاحیتوں کے جائزے میں پروگرامنگ، ریاضی، ڈیٹا کا تجزیہ، اور زبان کی ہدایات شامل ہیں۔
Qwen3 نامی اے آئی ماڈل سیریز علی بابا کی جانب سے 28 اپریل کو جاری کی گئی تھی۔ کمپنی کا دعویٰ ہے کہ یہ چیٹ بوٹ کچھ معاملات میں اوپن اے آئی یا گوگل کی جانب سے فی الحال دستیاب بہترین ماڈلز سے موازنہ کیا جا سکتا ہے اور اس سے بھی آگے نکل سکتا ہے۔
235 بلین پیرامیٹرز کے سائز کے ساتھ، Qwen3 DeepSeek-V2 اور OpenAI GPT-4 کے برابر ہے، جس کے بالترتیب تقریباً 236 بلین اور 175 بلین پیرامیٹرز ہیں۔ ماڈلز کی سیریز کے جاری ہونے کے بعد صارفین جلد ہی اسے اے آئی ڈویلپمنٹ پلیٹ فارم ہگنگ فیس اور گیتھب پر اوپن لائسنس کے تحت ڈاؤن لوڈ کر سکیں گے۔
کمپنی کا کہنا ہے کہ Qwen3 مجموعہ میں ہائبرڈ ماڈلز شامل ہیں، یعنی وہ پیچیدہ مسائل کو حل کرنے یا سادہ درخواستوں کا فوری جواب دینے کے لیے اپنا وقت لگا سکتے ہیں۔ اس صورت میں، اندازہ ماڈل کو معلومات کی درستگی کو خود چیک کرنے کی اجازت دیتا ہے، لیکن اس میں زیادہ تاخیر ہوتی ہے۔
یہ ڈیزائن صارفین کے لیے ہر مخصوص کام کے لیے مناسب بجٹ مختص کرنا آسان بناتا ہے۔ اس کے علاوہ، یہ ماڈل دنیا بھر کے بہت سے حریفوں سے بھی سیکھتا ہے۔
ڈیپ سیک کی طرح "ماہرین کا مرکب" (MoE) فن تعمیر کا استعمال کرتے ہوئے، Qwen3 تربیتی لاگت کے ایک حصے پر کمپیوٹیشنل کارکردگی کو زیادہ سے زیادہ کر سکتا ہے۔ یہ ایک ایسا نقطہ نظر ہے جو کسی کام کو الگ الگ حصوں میں تقسیم کرتا ہے اور انجام دینے کے لیے صرف کافی گہرے ڈیٹا کی سفارش کرتا ہے۔
ترقیاتی ٹیم کے مطابق، Qwen3 119 زبانوں کو سپورٹ کرتا ہے اور اسے تقریباً 36,000 بلین ٹوکنز کے ڈیٹاسیٹ پر تربیت دی جاتی ہے، جو کہ 27,000 بلین الفاظ کے برابر ہے۔ تربیتی ڈیٹا بہت سے ذرائع سے لیا جاتا ہے جیسے کہ نصابی کتب، سوال جواب سیٹ، پروگرامنگ کوڈ، یا خود تیار کردہ AI،...
اوپن سورس کی درجہ بندی میں سرفہرست ہونے کے باوجود، LiveBench کی جانب سے وسیع پیمانے پر جانچ سے پتہ چلتا ہے کہ Qwen3 دنیا کے معروف بند سورس AI ماڈلز سے پیچھے ہے، خاص طور پر OpenAI's o3، Google کا Gemini Pro 2.5، اور Anthropic's Claude 3.7۔
فی الحال، اوپن اے آئی کا ٹاپ آف دی لائن ماڈل جس کی مائیکروسافٹ کی حمایت حاصل ہے، o3-mini high، دنیا میں مجموعی AI ماڈل کی درجہ بندی میں سب سے اوپر ہے۔
ماخذ: https://znews.vn/deepseek-bi-soan-ngoi-post1551500.html










تبصرہ (0)