AI Kimi K2 dari China telah hilang kelayakan kerana berulang kali melakukan pergerakan haram - Foto: chess.com
Dengan kemenangan 4-0 yang memberangsangkan, Gemini 2.5 Pro, o4-mini, Grok 4 dan o3 mara ke separuh akhir kejohanan catur AI, mengalahkan Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash dan Kimi k2 masing-masing.
Pada suku akhir yang paling ketara, model Kimi K2 (China) Moonshot AI mengalami kekalahan teruk 0-4 menentang o3, LLM OpenAI - pembangun ChatGPT.
Keempat-empat perlawanan berakhir dengan pantas dalam masa kurang daripada lapan gerakan, kerana Kimi K2 berulang kali melakukan gerakan haram.
Sebagai contoh, dalam permainan ketiga, walaupun memahami kedudukan dengan betul apabila o3 diperiksa di belakang, Kimi K2 masih tidak menemui satu pun langkah undang-undang dalam keempat-empat percubaan, dan terpaksa mengaku kalah. Peratusan pergerakan yang sepadan dengan alat Stockfish o3 adalah sehingga 100%, menunjukkan bahawa perbezaan tahap kemahiran adalah terlalu besar.
Wakil China yang lain, DeepSeek, tidak beraksi lebih baik, kalah 0-4 kepada o4-mini OpenAI. Walaupun mereka melakukan lebih baik daripada rakan senegara mereka dengan bertahan pada perlawanan pertama, DeepSeek masih melakukan kesilapan dan telah disemak dalam perlawanan berikut.
Walau bagaimanapun, watak yang paling mengagumkan di suku akhir ialah Grok 4, model daripada Syarikat xAI milik jutawan Elon Musk. Grok 4 dengan mudah mengalahkan Gemini 2.5 Flash Google dengan skor 4-0. Dengan keupayaan untuk menghukum setiap kesilapan pihak lawan, kadar ketepatan langkah Grok 4 mencapai tahap tertinggi pusingan, kira-kira 97.5%.
Mengulas mengenai perlawanan itu, pemain No. 2 dunia Hikaru Nakamura terkejut: "Grok 4 pastinya LLM terkuat dalam kejohanan ini. Jurang tahap antaranya dan model lain tidaklah kecil."
Komen ini diperkuatkan lagi apabila Encik Musk dengan cepat berkongsi semula imej komen Nakamura di rangkaian sosial X, bersama dengan komen yakin: "Ini hanyalah kesan sampingan. xAI hampir tidak menghabiskan masa untuk bermain catur."
Pemain catur Nakamura berkata Grok 4 benar-benar "kalah" dalam kejohanan AI - Foto: tangkapan skrin
Di pihak Google, walaupun Gemini 2.5 Flash telah disingkirkan, wakil mereka yang tinggal, Gemini 2.5 Pro, mempunyai kemenangan meyakinkan 4-0 ke atas Claude 4 Opus of Anthropic Company, mengesahkan kedudukannya dalam kejohanan itu.
Perlawanan separuh akhir akan berlangsung pada 0:30 pada 7 Ogos (waktu Vietnam). Separuh akhir pertama ialah perlawanan berisiko tinggi antara Grok 4 dan Gemini 2.5 Pro. Perlawanan lain ialah "derby OpenAI" yang dramatik antara o3 dan o4-mini.
TUAN LONG
Sumber: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Komen (0)