Spelaren Nakamura sa att Grok 4 verkade spela med en spänd mentalitet i den sista matchen - Foto: skärmdump
Innan matchen väckte OpenAI uppståndelse när de tillkännagav lanseringen av sin elfte generationens LLM, GPT-5.
Emellertid visade o3-ChatGPT-modellen som användes i finalen fortfarande stark resonemangsförmåga, med en genomsnittlig korrekt dragfrekvens på upp till 90,8 %, vilket helt överträffade Grok 4:s 80,2 %.
I alla fyra partierna gav ChatGPT inte Grok 4 någon chans och satte matt med sin motståndare efter 35, 30, 28 respektive 54 drag.
Enligt världstvåan Hikaru Nakamura verkade Grok 4 spela med mer spänning och göra fler misstag än i tidigare rundor. I synnerhet tappade de pjäser lätt – en sällsynt händelse när de överväldigande besegrade Googles Gemini 2.5 Flash och Gemini 2.5 Pro.
Med tre raka vinster med 4-0 och en genomsnittlig träffsäkerhet på upp till 91 % avslutade o3 turneringen perfekt.
Även om o3:s styrka inte kan jämföras med professionella schackstormästare, är den tillräckligt för att orsaka svårigheter för spelare med Elo under 2 000. Särskilt i kategorierna blitz och superblitz.
Den Google-organiserade turneringen slutade med de amerikanska representanternas absoluta dominans. Medan de två kinesiska modellerna, Kimi K4 och DeepSeek, båda blev utslagna tidigt, så vann Gemini 2.5 Pro över o4-mini i tredjeplatsmatchen, vilket befäste positionen som de ledande amerikanska teknikföretagen.
Detta evenemang visar inte bara de fantastiska förmågorna hos generella AI-modeller inom ett specialiserat område. Det öppnar också upp ett nytt perspektiv på den potentiella utvecklingen av artificiell intelligens i framtiden.
Det är dock också en påminnelse om att även om juridikprogram utvecklas snabbt, kan de fortfarande inte matcha nivån på professionella schackmaskiner, vars Elo-betyg vida överstiger människors.
Källa: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Kommentar (0)