AI Kimi K2 dari Tiongkok didiskualifikasi karena berulang kali melakukan gerakan ilegal - Foto: chess.com
Dengan kemenangan mutlak 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 dan o3 telah melaju dengan sangat baik ke semi-final turnamen catur AI, setelah mengalahkan Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash dan Kimi k2 secara berurutan.
Pada perempat final yang paling menonjol, model Kimi K2 dari Moonshot AI (Tiongkok) mengalami kekalahan telak 0-4 melawan o3, LLM dari OpenAI - pengembang ChatGPT.
Keempat permainan berakhir dengan cepat dalam waktu kurang dari delapan gerakan, karena Kimi K2 berulang kali melakukan gerakan ilegal.
Misalnya, pada permainan ketiga, meskipun telah memahami posisi dengan benar ketika o3 memeriksa kembali, Kimi K2 tetap tidak dapat menemukan langkah yang sah dalam keempat percobaan, dan terpaksa mengakui kekalahan. Persentase langkah yang cocok dengan alat Stockfish o3 mencapai 100%, menunjukkan bahwa perbedaan tingkat keahlian terlalu besar.
Perwakilan Tiongkok lainnya, DeepSeek, tidak jauh lebih baik, kalah 0-4 dari o4-mini OpenAI. Meskipun mereka bermain lebih baik daripada rekan senegaranya dengan bertahan di game pertama, DeepSeek masih membuat kesalahan dan skakmat di game-game berikutnya.
Namun, karakter paling impresif di babak perempat final adalah Grok 4, seorang model dari Perusahaan xAI milik miliarder Elon Musk. Grok 4 dengan mudah mengalahkan Gemini 2.5 Flash milik Google dengan skor 4-0. Dengan kemampuannya untuk menghukum setiap kesalahan lawan, tingkat akurasi gerakan Grok 4 mencapai level tertinggi di ronde tersebut, sekitar 97,5%.
Mengomentari pertandingan tersebut, pemain nomor 2 dunia Hikaru Nakamura terkejut: "Grok 4 jelas merupakan LLM terkuat di turnamen ini. Kesenjangan level antara model ini dan model lainnya tidak kecil."
Komentar ini diperkuat ketika Tn. Musk dengan cepat membagikan ulang gambar komentar Nakamura di jejaring sosial X, disertai komentar yakin: "Ini hanya efek samping. xAI hampir tidak menghabiskan waktu untuk catur."
Pemain catur Nakamura mengatakan Grok 4 benar-benar "keluar dari permainan" di turnamen AI - Foto: tangkapan layar
Di pihak Google, meskipun Gemini 2.5 Flash tereliminasi, perwakilan mereka yang tersisa, Gemini 2.5 Pro, memperoleh kemenangan meyakinkan 4-0 atas Claude 4 Opus dari Anthropic Company, yang menegaskan posisinya di turnamen tersebut.
Semifinal akan berlangsung pukul 00.30 tanggal 7 Agustus (waktu Vietnam). Semifinal pertama akan mempertandingkan Grok 4 dan Gemini 2.5 Pro. Pertandingan selanjutnya akan menjadi "derby OpenAI" yang dramatis antara o3 dan o4-mini.
TUAN LONG
Sumber: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Komentar (0)