AI Kimi K2 dari Tiongkok didiskualifikasi karena berulang kali melakukan gerakan ilegal - Foto: chess.com
Dengan kemenangan gemilang 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 dan o3 melaju ke semi-final turnamen catur AI, mengalahkan Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash dan Kimi k2.
Pada perempat final yang paling menonjol, model Kimi K2 dari Moonshot AI (Tiongkok) mengalami kekalahan telak 0-4 melawan o3, LLM dari OpenAI - pengembang ChatGPT.
Keempat permainan berakhir dengan cepat dalam waktu kurang dari delapan gerakan, karena Kimi K2 berulang kali melakukan gerakan ilegal.
Misalnya, pada permainan ketiga, meskipun Kimi K2 memahami posisi dengan benar ketika o3 memeriksa di belakang, ia tetap tidak dapat menemukan satu pun langkah yang sah dalam keempat percobaan, dan terpaksa mengakui kekalahan. Persentase langkah yang cocok dengan alat Stockfish o3 mencapai 100%, menunjukkan bahwa perbedaan tingkat keahlian terlalu besar.
Perwakilan Tiongkok lainnya, DeepSeek, tidak lebih baik, kalah 0-4 dari o4-mini OpenAI. Meskipun mereka bermain lebih baik daripada rekan senegaranya dengan bertahan di game pertama, DeepSeek masih membuat kesalahan dan skakmat di game-game berikutnya.
Namun, karakter paling impresif di babak perempat final adalah Grok 4, seorang model dari Perusahaan xAI milik miliarder Elon Musk. Grok 4 dengan mudah mengalahkan Gemini 2.5 Flash milik Google dengan skor 4-0. Dengan kemampuannya untuk menghukum setiap kesalahan lawan, tingkat akurasi gerakan Grok 4 mencapai level tertinggi di ronde tersebut, sekitar 97,5%.
Mengomentari pertandingan tersebut, pemain nomor 2 dunia Hikaru Nakamura terkejut: "Grok 4 jelas merupakan LLM terkuat di turnamen ini. Kesenjangan level antara model ini dan model lainnya tidak kecil."
Komentar ini semakin diperkuat ketika Tn. Musk dengan cepat membagikan ulang gambar komentar Nakamura di jejaring sosial X, disertai komentar penuh percaya diri: "Ini hanyalah efek samping. xAI hampir tidak menghabiskan waktu untuk catur."
Pemain catur Nakamura mengatakan Grok 4 benar-benar "di luar liganya" di turnamen AI - Foto: tangkapan layar
Di pihak Google, meskipun Gemini 2.5 Flash tereliminasi, perwakilan mereka yang tersisa, Gemini 2.5 Pro, memperoleh kemenangan meyakinkan 4-0 atas Claude 4 Opus dari Anthropic Company, yang menegaskan posisinya di turnamen tersebut.
Semifinal akan berlangsung pukul 00.30 tanggal 7 Agustus (waktu Vietnam). Semifinal pertama akan mempertandingkan Grok 4 dan Gemini 2.5 Pro dengan taruhan tinggi. Pertandingan lainnya adalah "derby OpenAI" yang dramatis antara o3 dan o4-mini.
TUAN LONG
Sumber: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Komentar (0)