Chińczyk AI Kimi K2 został zdyskwalifikowany za wielokrotne wykonywanie nielegalnych ruchów - Zdjęcie: chess.com
Dzięki zdecydowanemu zwycięstwu 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 i o3 awansowały do półfinałów turnieju szachowego AI, pokonując odpowiednio Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash i Kimi k2.
W najbardziej pamiętnym ćwierćfinale model Kimi K2 firmy Moonshot AI (Chiny) poniósł katastrofalną porażkę 0-4 z o3, LLM firmy OpenAI – twórcą ChatGPT.
Wszystkie cztery partie zakończyły się szybko, w mniej niż ośmiu posunięciach, ponieważ Kimi K2 wielokrotnie wykonywał niedozwolone ruchy.
Na przykład w trzeciej grze, pomimo prawidłowego zrozumienia pozycji, gdy o3 sprawdził za plecami, Kimi K2 nadal nie znalazł ani jednego prawidłowego ruchu we wszystkich czterech próbach i został zmuszony do przyznania się do porażki. Odsetek ruchów, które pasowały do narzędzia Stockfish o3, sięgał nawet 100%, co wskazywało na zbyt dużą różnicę w poziomie umiejętności.
Drugi chiński reprezentant, DeepSeek, nie poradził sobie lepiej, przegrywając 0:4 z o4-mini z OpenAI. Chociaż poradzili sobie lepiej od swoich rodaków, utrzymując przewagę w pierwszej partii, DeepSeek nadal popełniał błędy i został zamatowany w kolejnych partiach.
Jednak najbardziej imponującą postacią w ćwierćfinale był Grok 4, model z firmy xAI miliardera Elona Muska. Grok 4 z łatwością pokonał Gemini 2.5 Flash od Google'a, wygrywając 4:0. Dzięki możliwości ukarania każdego błędu przeciwnika, wskaźnik celności ruchów Groka 4 osiągnął najwyższy poziom w tej rundzie, wynoszący około 97,5%.
Komentując mecz, drugi zawodnik świata , Hikaru Nakamura, był zaskoczony: „Grok 4 to zdecydowanie najsilniejszy LLM w tym turnieju. Różnica poziomów między nim a innymi modelami nie jest mała”.
Komentarz ten został jeszcze bardziej wzmocniony, gdy Musk szybko udostępnił ponownie zdjęcie komentarza Nakamury na portalu społecznościowym X, dodając pewny siebie komentarz: „To tylko efekt uboczny. xAI prawie w ogóle nie poświęca czasu szachom”.
Szachista Nakamura powiedział, że Grok 4 był całkowicie „poza jego ligą” na turnieju AI - Zdjęcie: zrzut ekranu
Po stronie Google, mimo że Gemini 2.5 Flash odpadł, ich pozostały przedstawiciel, Gemini 2.5 Pro, odniósł przekonujące zwycięstwo 4-0 nad Claude 4 Opus z Anthropic Company, umacniając swoją pozycję w turnieju.
Półfinały odbędą się 7 sierpnia o godzinie 0:30 czasu wietnamskiego. Pierwszy półfinał to mecz o wysoką stawkę pomiędzy Grok 4 i Gemini 2.5 Pro. Drugi mecz to dramatyczny „derby OpenAI” pomiędzy o3 i o4-mini.
TUAN LONG
Źródło: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm






Komentarz (0)