چین سے AI Kimi K2 کو بار بار غیر قانونی حرکتیں کرنے پر نااہل قرار دے دیا گیا - تصویر: chess.com
4-0 کی قطعی فتح کے ساتھ، Gemini 2.5 Pro، o4-mini، Grok 4 اور o3 نے بالترتیب Claude 4 Opus، DeepSeek R1، Gemini 2.5 Flash اور Kimi k2 کو شکست دینے کے بعد AI شطرنج ٹورنامنٹ کے سیمی فائنل میں جگہ بنا لی ہے۔
سب سے قابل ذکر کوارٹر فائنل میں، Moonshot AI کے Kimi K2 ماڈل (چین) کو ChatGPT کے ڈویلپر - OpenAI کے LLM o3 کے خلاف 0-4 سے تباہ کن شکست کا سامنا کرنا پڑا۔
تمام چار کھیل آٹھ سے بھی کم چالوں میں تیزی سے ختم ہو گئے، کیونکہ Kimi K2 نے بار بار غیر قانونی حرکتیں کیں۔
مثال کے طور پر، تیسری گیم میں، پوزیشن کو صحیح طریقے سے سمجھنے کے باوجود جب o3 نے دوبارہ چیک کیا، Kimi K2 پھر بھی چاروں کوششوں میں کوئی قانونی اقدام نہیں ڈھونڈ سکا، اور اسے شکست تسلیم کرنے پر مجبور کیا گیا۔ o3 کے اسٹاک فش ٹول سے مماثل چالوں کا فیصد 100% تک تھا، جس سے ظاہر ہوتا ہے کہ مہارت کی سطح میں فرق بہت زیادہ تھا۔
دوسرے چینی نمائندے، ڈیپ سیک نے زیادہ بہتر کارکردگی کا مظاہرہ نہیں کیا، جو OpenAI کے o4-mini سے 0-4 سے ہار گئے۔ اگرچہ انہوں نے پہلے گیم میں اپنے ہم وطنوں سے بہتر کارکردگی کا مظاہرہ کیا، پھر بھی ڈیپ سیک نے غلطیاں کیں اور مندرجہ ذیل گیمز میں چیک میٹ کیا گیا۔
تاہم، کوارٹر فائنل میں سب سے زیادہ متاثر کن کردار گروک 4 تھا، جو ارب پتی ایلون مسک کی xAI کمپنی کا ماڈل تھا۔ گروک 4 نے گوگل کے جیمنی 2.5 فلیش کو آسانی سے 4-0 کے اسکور کے ساتھ شکست دی۔ حریف کی ہر غلطی کی سزا دینے کی صلاحیت کے ساتھ، Grok 4 کی حرکت کی درستگی کی شرح راؤنڈ کی بلند ترین سطح، تقریباً 97.5% تک پہنچ گئی۔
میچ پر تبصرہ کرتے ہوئے، دنیا کے نمبر 2 کھلاڑی Hikaru Nakamura نے حیرانی کا اظہار کیا: "Grok 4 یقینی طور پر اس ٹورنامنٹ میں سب سے مضبوط LLM ہے۔ اس کے اور دیگر ماڈلز کے درمیان سطح کا فرق کم نہیں ہے۔"
اس تبصرے کو اس وقت تقویت ملی جب مسٹر مسک نے ناکامورا کے تبصرے کی تصویر کو سوشل نیٹ ورک X پر تیزی سے دوبارہ شیئر کیا، اس کے ساتھ پراعتماد تبصرہ بھی کیا: "یہ صرف ایک ضمنی اثر ہے۔ xAI شطرنج پر تقریباً کوئی وقت نہیں گزارتا۔"
شطرنج کے کھلاڑی ناکامورا نے کہا کہ گروک 4 AI ٹورنامنٹ میں مکمل طور پر "کھیل سے باہر" تھا - تصویر: اسکرین شاٹ
گوگل کی طرف سے، اگرچہ جیمنی 2.5 فلیش کو ختم کر دیا گیا تھا، لیکن ان کے بقیہ نمائندے، جیمنی 2.5 پرو، نے ٹورنامنٹ میں اپنی پوزیشن کی تصدیق کرتے ہوئے، Anthropic کمپنی کے Claude 4 Opus پر 4-0 سے کامیابی حاصل کی۔
سیمی فائنل 7 اگست (ویتنام کے وقت) کو 0:30 بجے ہوں گے۔ پہلا سیمی فائنل Grok 4 اور Gemini 2.5 Pro کے درمیان ایک اعلیٰ سطحی تصادم ہے۔ باقی میچ o3 اور o4-mini کے درمیان ڈرامائی "اوپن اے آئی ڈربی" ہے۔
TUAN لمبا
ماخذ: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
تبصرہ (0)