قال اللاعب ناكامورا إن فريق Grok 4 بدا وكأنه لعب بعقلية متوترة في المباراة النهائية - صورة: لقطة شاشة
قبل المباراة، أحدثت شركة OpenAI ضجة عندما أعلنت عن إطلاق الجيل الحادي عشر من LLM، GPT-5.
ومع ذلك، أظهر نموذج o3 - ChatGPT المستخدم في النسخة النهائية قدرات استنتاجية قوية، مع معدل حركة صحيح متوسط يصل إلى 90.8%، متجاوزًا تمامًا معدل Grok 4 البالغ 80.2%.
في جميع المباريات الأربع، لم يمنح ChatGPT Grok 4 أي فرصة، حيث تغلب على خصمه بعد 35 و30 و28 و54 حركة على التوالي.
وفقًا للمصنف الثاني عالميًا هيكارو ناكامورا، بدا أن غروك 4 يلعب بتوتر أكبر ويرتكب أخطاءً أكثر من الجولات السابقة. وتحديدًا، فقد خسر بسهولة - وهو أمر نادر الحدوث عندما هزم بفارق كبير جهازي جيميني 2.5 فلاش وجيميني 2.5 برو من جوجل.
مع ثلاثة انتصارات متتالية بنتيجة 4-0 ومعدل دقة يصل إلى 91٪، أنهى o3 البطولة بشكل مثالي.
مع أن قوة o3 لا تُقارن بأساتذة الشطرنج المحترفين، إلا أنها كافية لإثارة المشاكل للاعبين الذين يقل تصنيفهم عن 2000، خاصةً في فئتي البليتز والسوبر بليتز.
انتهت البطولة التي نظمتها جوجل بهيمنة مطلقة للممثلين الأمريكيين. وبينما أُقصي النموذجان الصينيان، كيمي كيه 4 وديب سيك، مبكرًا، فاز جيميني 2.5 برو في مباراة المركز الثالث على o4-mini، مؤكدًا بذلك مكانة شركات التكنولوجيا الأمريكية الرائدة.
لا يُظهر هذا الحدث القدرات المذهلة لنماذج الذكاء الاصطناعي متعددة الأغراض في مجال متخصص فحسب، بل يفتح أيضًا آفاقًا جديدة لإمكانات تطوير الذكاء الاصطناعي في المستقبل.
ومع ذلك، فهو بمثابة تذكير أيضًا بأنه على الرغم من التطور السريع لبرامج الماجستير في القانون، إلا أنها لا تزال غير قادرة على مواكبة مستوى محركات الشطرنج الاحترافية، التي تتجاوز تصنيفاتها ELO بكثير تصنيفات البشر.
المصدر: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
تعليق (0)