Spiller Nakamura sa at Grok 4 så ut til å spille med en anspent mentalitet i den siste kampen - Foto: skjermbilde
Før kampen skapte OpenAI oppstyr da de annonserte lanseringen av sin 11. generasjons LLM, GPT-5.
Imidlertid viste o3-ChatGPT-modellen som ble brukt i finalen fortsatt sterk resonneringsevne, med en gjennomsnittlig korrekt trekkrate på opptil 90,8 %, som fullstendig overgikk Grok 4s 80,2 %.
I alle fire partiene ga ikke ChatGPT Grok 4 noen sjanse, og satte motstanderen sjakkmatt etter henholdsvis 35, 30, 28 og 54 trekk.
Ifølge verdens nummer to, Hikaru Nakamura, virket det som om Grok 4 spilte med mer spenning og gjorde flere feil enn i tidligere runder. Spesielt mistet de brikker lett – en sjelden forekomst da de overveldende slo Googles Gemini 2.5 Flash og Gemini 2.5 Pro.
Med tre seire på rad med en score på 4-0 og en gjennomsnittlig treffsikkerhet på opptil 91 %, avsluttet o3 turneringen perfekt.
Selv om o3s kraft ikke kan sammenlignes med profesjonelle sjakkstormestere, er den nok til å skape vanskeligheter for spillere med Elo under 2000. Spesielt i kategoriene blitz og superblitz.
Den Google-organiserte turneringen endte med absolutt dominans fra de amerikanske representantene. Mens de to kinesiske modellene, Kimi K4 og DeepSeek, begge ble eliminert tidlig, vant Gemini 2.5 Pro over o4-mini i tredjeplasskampen, noe som befestet posisjonen til de ledende amerikanske teknologiselskapene.
Denne hendelsen viser ikke bare de fantastiske egenskapene til generelle AI-modeller innen et spesialisert felt. Den åpner også opp et nytt perspektiv på den potensielle utviklingen av kunstig intelligens i fremtiden.
Det er imidlertid også en påminnelse om at selv om LLM-er utvikler seg raskt, kan de fortsatt ikke matche nivået til profesjonelle sjakkmaskiner, hvis Elo-rangeringer langt overgår menneskers.
Kilde: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Kommentar (0)