Pemain Nakamura mengatakan Grok 4 tampak bermain dengan mentalitas tegang di pertandingan final - Foto: tangkapan layar
Sebelum pertandingan, OpenAI membuat kehebohan ketika mengumumkan peluncuran LLM generasi ke-11, GPT-5.
Namun, model o3 - ChatGPT yang digunakan dalam ujian akhir masih menunjukkan kemampuan penalaran yang kuat, dengan tingkat ketepatan langkah rata-rata mencapai 90,8%, jauh melampaui Grok 4 yang hanya 80,2%.
Dalam keempat permainan, ChatGPT tidak memberi Grok 4 peluang apa pun, dan melakukan skakmat pada lawannya setelah masing-masing 35, 30, 28, dan 54 gerakan.
Menurut pemain nomor 2 dunia , Hikaru Nakamura, Grok 4 tampak bermain dengan lebih tegang dan membuat lebih banyak kesalahan dibandingkan babak-babak sebelumnya. Khususnya, Grok 4 mudah kehilangan bagian-bagiannya – sebuah kejadian langka ketika mereka secara meyakinkan mengalahkan Gemini 2.5 Flash dan Gemini 2.5 Pro milik Google.
Dengan tiga kemenangan berturut-turut dengan skor 4-0 dan tingkat akurasi rata-rata hingga 91%, o3 mengakhiri turnamen dengan sempurna.
Meskipun kekuatan o3 tidak sebanding dengan grandmaster catur profesional, kekuatannya cukup untuk menyulitkan pemain dengan Elo di bawah 2.000. Terutama dalam kategori blitz dan super blitz.
Turnamen yang diselenggarakan Google berakhir dengan dominasi mutlak perwakilan Amerika. Meskipun dua model Tiongkok, Kimi K4 dan DeepSeek, tersingkir lebih awal, perebutan tempat ketiga dimenangkan oleh Gemini 2.5 Pro atas o4-mini, yang mengukuhkan posisi perusahaan teknologi Amerika terkemuka.
Acara ini tidak hanya menunjukkan kemampuan luar biasa model AI serbaguna dalam bidang khusus, tetapi juga membuka perspektif baru tentang potensi pengembangan kecerdasan buatan di masa depan.
Namun, hal ini juga menjadi pengingat bahwa meskipun LLM berkembang pesat, mereka masih belum dapat menyamai tingkat mesin catur profesional, yang peringkat Elo-nya jauh melampaui manusia.
Sumber: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Komentar (0)