قال اللاعب ناكامورا إن فريق Grok 4 بدا وكأنه يلعب بعقلية متوترة في المباراة النهائية - صورة: لقطة شاشة
قبل المباراة، أحدثت شركة OpenAI ضجة عندما أعلنت عن إطلاق الجيل الحادي عشر من برنامج LLM، GPT-5.
ومع ذلك، فإن نموذج o3 - ChatGPT المستخدم في النهائي أظهر قدرة قوية على التفكير المنطقي، مع معدل حركة صحيح متوسط يصل إلى 90.8%، متجاوزًا تمامًا معدل Grok 4 البالغ 80.2%.
في جميع المباريات الأربع، لم يمنح ChatGPT Grok 4 أي فرصة، حيث تغلب على خصمه بعد 35 و30 و28 و54 حركة على التوالي.
وفقًا للمصنف الثاني عالميًا هيكارو ناكامورا، بدا أن غروك 4 يلعب بتوتر أكبر ويرتكب أخطاءً أكثر من الجولات السابقة. وتحديدًا، فقد خسر بسهولة - وهو أمر نادر الحدوث عندما هزم بفارق كبير جهازي جيميني 2.5 فلاش وجيميني 2.5 برو من جوجل.
مع ثلاثة انتصارات متتالية بنتيجة 4-0 ومعدل دقة يصل إلى 91٪، أنهى o3 البطولة بشكل مثالي.
مع أن قوة o3 لا تُضاهي قوة أساتذة الشطرنج المحترفين، إلا أنها كافية لتُسبب صعوبات للاعبين ذوي تصنيف ELO أقل من 2000، خاصةً في فئتي blitz وsuper blitz.
انتهت البطولة التي نظمتها جوجل بهيمنة مطلقة للممثلين الأمريكيين. وبينما أُقصي النموذجان الصينيان، كيمي كيه 4 وديب سيك، مبكرًا، شهدت مباراة تحديد المركز الثالث فوز جيميني 2.5 برو على o4-mini، مؤكدةً بذلك مكانة شركات التكنولوجيا الأمريكية الرائدة.
لا يُظهر هذا الحدث القدرات المذهلة لنماذج الذكاء الاصطناعي متعددة الأغراض في مجال متخصص فحسب، بل يفتح أيضًا آفاقًا جديدةً للتطور المُحتمل للذكاء الاصطناعي في المستقبل.
ومع ذلك، فهو بمثابة تذكير أيضًا بأنه على الرغم من التطور السريع لبرامج الماجستير في القانون، إلا أنها لا تزال غير قادرة على مواكبة مستوى محركات الشطرنج الاحترافية، التي تتجاوز تصنيفاتها ELO بكثير تصنيفات البشر.
المصدر: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
تعليق (0)