
Spelaren Nakamura sa att Grok 4 verkade ha spelat med en spänd mentalitet i den sista matchen - Foto: skärmdump
Innan matchen väckte OpenAI uppståndelse när de tillkännagav lanseringen av den 11:e generationen av LLM, GPT-5.
Emellertid visade o3-ChatGPT-modellen som användes i finalen fortfarande starka inferensförmågor, med en genomsnittlig korrekt förflyttningshastighet på upp till 90,8 %, vilket helt överträffade Grok 4:s 80,2 %.
I alla fyra partierna gav ChatGPT inte Grok 4 någon chans och satte matt med sin motståndare efter 35, 30, 28 respektive 54 drag.
Enligt världstvåan Hikaru Nakamura verkade Grok 4 spela med mer spänning och göra fler misstag än i tidigare rundor. I synnerhet tappade de pjäser lätt – en sällsynt händelse när de överväldigande besegrade Googles Gemini 2.5 Flash och Gemini 2.5 Pro.
Med tre raka vinster med 4-0 och en genomsnittlig träffsäkerhet på upp till 91 % avslutade o3 turneringen perfekt.
Även om o3:s styrka inte kan jämföras med professionella schackstormästare, är den tillräckligt för att orsaka problem för spelare med Elo under 2 000. Särskilt i blitz- och superblitzkategorierna.
Den Google-organiserade turneringen avslutades med absolut dominans av de amerikanska representanterna. Medan de två kinesiska modellerna, Kimi K4 och DeepSeek, båda blev utslagna tidigt, vanns tredjeplatsmatchen av Gemini 2.5 Pro över o4-mini, vilket befäste positionen som de ledande amerikanska teknikföretagen.
Detta evenemang visar inte bara de fantastiska förmågorna hos generella AI-modeller inom ett specialiserat område. Det öppnar också ett nytt perspektiv på utvecklingspotentialen för artificiell intelligens i framtiden.
Det är dock också en påminnelse om att även om juridikprogram utvecklas snabbt, kan de fortfarande inte matcha nivån på professionella schackmaskiner, vars Elo-betyg vida överstiger människors.
Källa: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm






Kommentar (0)