کھلاڑی ناکامورا نے کہا کہ گروک 4 فائنل میچ میں تناؤ کی ذہنیت کے ساتھ کھیلتا دکھائی دے رہا تھا - تصویر: اسکرین شاٹ
میچ سے پہلے، OpenAI نے اس وقت ہلچل مچا دی جب اس نے اپنی 11ویں جنریشن LLM، GPT-5 کے اجراء کا اعلان کیا۔
تاہم، فائنل میں استعمال ہونے والے o3 - ChatGPT ماڈل نے اب بھی مضبوط استدلال کی قابلیت کا مظاہرہ کیا، جس کی اوسط درست حرکت کی شرح 90.8% تک تھی، جو Grok 4 کے 80.2% کو مکمل طور پر پیچھے چھوڑتی ہے۔
چاروں گیمز میں، ChatGPT نے Grok 4 کو کوئی موقع نہیں دیا، بالترتیب 35، 30، 28 اور 54 چالوں کے بعد اپنے حریف کو چیک کیا۔
عالمی نمبر 2 ہیکارو ناکامورا کے مطابق گروک 4 پچھلے راؤنڈز کے مقابلے زیادہ تناؤ کے ساتھ کھیلتا اور زیادہ غلطیاں کرتا دکھائی دے رہا تھا۔ خاص طور پر، اس کے ٹکڑے آسانی سے کھو گئے - ایک نادر واقعہ جب اس نے گوگل کے جیمنی 2.5 فلیش اور جیمنی 2.5 پرو کو زبردست شکست دی۔
4-0 کے اسکور کے ساتھ لگاتار تین جیت اور 91% تک کی اوسط درستگی کی شرح کے ساتھ، o3 نے ٹورنامنٹ کا مکمل خاتمہ کیا۔
اگرچہ o3 کی طاقت کا موازنہ شطرنج کے پیشہ ور گرانڈ ماسٹرز سے نہیں کیا جا سکتا، لیکن یہ Elo 2,000 سے کم عمر کے کھلاڑیوں کے لیے مشکلات پیدا کرنے کے لیے کافی ہے۔ خاص طور پر بلٹز اور سپر بلٹز کی کیٹیگریز میں۔
گوگل کے زیر اہتمام ٹورنامنٹ امریکی نمائندوں کے مکمل غلبے کے ساتھ ختم ہوا۔ جبکہ دو چینی ماڈلز، Kimi K4 اور DeepSeek، دونوں کو جلد ہی ختم کر دیا گیا، تیسری پوزیشن کے میچ میں جیمنی 2.5 پرو کو o4-mini پر فتح حاصل ہوئی، جس نے معروف امریکی ٹیکنالوجی کمپنیوں کی پوزیشن کی تصدیق کی۔
یہ ایونٹ نہ صرف ایک خصوصی شعبے میں عمومی مقصد کے AI ماڈلز کی حیرت انگیز صلاحیتوں کو ظاہر کرتا ہے۔ یہ مستقبل میں مصنوعی ذہانت کی ممکنہ ترقی پر ایک نیا نقطہ نظر بھی کھولتا ہے۔
تاہم، یہ ایک یاد دہانی بھی ہے کہ جب LLMs تیزی سے ترقی کر رہے ہیں، وہ اب بھی پیشہ ورانہ شطرنج کے انجنوں کی سطح سے مماثل نہیں ہو سکتے، جن کی Elo کی درجہ بندی انسانوں سے کہیں زیادہ ہے۔
ماخذ: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
تبصرہ (0)