Pemain Nakamura mengatakan Grok 4 tampak bermain dengan mental tegang di laga final - Foto: tangkapan layar
Sebelum pertandingan, OpenAI membuat kehebohan ketika mengumumkan peluncuran LLM generasi ke-11, GPT-5.
Namun, model o3 - ChatGPT yang digunakan dalam ujian akhir masih menunjukkan kemampuan inferensi yang kuat, dengan tingkat ketepatan langkah rata-rata hingga 90,8%, yang sepenuhnya melampaui Grok 4 yang hanya mencapai 80,2%.
Dalam keempat permainan, ChatGPT tidak memberi Grok 4 peluang apa pun, dan melakukan skakmat pada lawannya setelah masing-masing 35, 30, 28, dan 54 gerakan.
Menurut pemain nomor 2 dunia , Hikaru Nakamura, Grok 4 tampak bermain dengan lebih tegang dan membuat lebih banyak kesalahan dibandingkan babak-babak sebelumnya. Khususnya, Grok 4 mudah kehilangan bagian-bagiannya – sebuah kejadian langka ketika mereka secara meyakinkan mengalahkan Gemini 2.5 Flash dan Gemini 2.5 Pro milik Google.
Dengan tiga kemenangan berturut-turut dengan skor 4-0 dan tingkat akurasi rata-rata hingga 91%, o3 mengakhiri turnamen dengan sempurna.
Meskipun kekuatan o3 tidak sebanding dengan grandmaster catur profesional, kekuatannya cukup untuk menyulitkan pemain dengan Elo di bawah 2.000. Terutama di kategori blitz dan super blitz.
Turnamen yang diselenggarakan Google berakhir dengan dominasi mutlak perwakilan Amerika. Meskipun dua model Tiongkok, Kimi K4 dan DeepSeek, tersingkir lebih awal, perebutan tempat ketiga dimenangkan oleh Gemini 2.5 Pro atas o4-mini, yang menegaskan posisi perusahaan teknologi Amerika terkemuka.
Acara ini tidak hanya menunjukkan kemampuan luar biasa model AI serbaguna di bidang khusus, tetapi juga membuka perspektif baru tentang potensi pengembangan kecerdasan buatan di masa depan.
Namun, hal ini juga menjadi pengingat bahwa meskipun LLM berkembang pesat, mereka masih belum dapat menyamai tingkat mesin catur profesional, yang peringkat Elo-nya jauh melampaui manusia.
Sumber: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Komentar (0)