کھلاڑی ناکامورا نے کہا کہ لگتا ہے کہ گروک 4 نے فائنل میچ میں تناؤ کی ذہنیت کے ساتھ کھیلا تھا - تصویر: اسکرین شاٹ
میچ سے پہلے، OpenAI نے اس وقت ہلچل مچا دی جب اس نے LLM، GPT-5 کی 11ویں جنریشن کے آغاز کا اعلان کیا۔
تاہم، فائنل میں استعمال ہونے والے o3 - ChatGPT ماڈل نے اب بھی مضبوط تخمینہ صلاحیتوں کا مظاہرہ کیا، جس کی اوسط درست حرکت کی شرح 90.8% تک تھی، جو Grok 4 کے 80.2% کو مکمل طور پر پیچھے چھوڑتی ہے۔
چاروں گیمز میں، ChatGPT نے Grok 4 کو کوئی موقع نہیں دیا، بالترتیب 35، 30، 28 اور 54 چالوں کے بعد اپنے حریف کو چیک کیا۔
عالمی نمبر 2 ہیکارو ناکامورا کے مطابق گروک 4 پچھلے راؤنڈز کے مقابلے زیادہ تناؤ کے ساتھ کھیلتا اور زیادہ غلطیاں کرتا دکھائی دے رہا تھا۔ خاص طور پر، اس کے ٹکڑے آسانی سے کھو گئے - ایک نادر واقعہ جب اس نے گوگل کے جیمنی 2.5 فلیش اور جیمنی 2.5 پرو کو زبردست شکست دی۔
4-0 کے اسکور کے ساتھ لگاتار تین جیت اور 91% تک کی اوسط درستگی کی شرح کے ساتھ، o3 نے ٹورنامنٹ کا مکمل خاتمہ کیا۔
اگرچہ o3 کی طاقت کا پیشہ ور شطرنج کے گرانڈ ماسٹرز سے موازنہ نہیں کیا جا سکتا، لیکن یہ Elo 2,000 سے کم عمر کے کھلاڑیوں کے لیے پریشانی پیدا کرنے کے لیے کافی ہے۔ خاص طور پر بلٹز اور سپر بلٹز کیٹیگریز میں۔
گوگل کے زیر اہتمام ٹورنامنٹ امریکی نمائندوں کے مکمل غلبے کے ساتھ ختم ہوا۔ جبکہ دو چینی ماڈلز، Kimi K4 اور DeepSeek کو جلد ہی ختم کر دیا گیا، تیسری پوزیشن کا میچ Gemini 2.5 Pro نے o4-mini پر جیت لیا، جس نے معروف امریکی ٹیکنالوجی کمپنیوں کی پوزیشن کی تصدیق کی۔
یہ ایونٹ نہ صرف ایک خصوصی شعبے میں عمومی مقصد کے AI ماڈلز کی حیرت انگیز صلاحیتوں کو ظاہر کرتا ہے۔ یہ مستقبل میں مصنوعی ذہانت کی ترقی کی صلاحیت پر ایک نیا نقطہ نظر بھی کھولتا ہے۔
تاہم، یہ ایک یاد دہانی بھی ہے کہ جب LLMs تیزی سے ترقی کر رہے ہیں، وہ اب بھی پیشہ ورانہ شطرنج کے انجنوں کی سطح سے مماثل نہیں ہو سکتے، جن کی Elo کی درجہ بندی انسانوں سے کہیں زیادہ ہے۔
ماخذ: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
تبصرہ (0)