
Pemain Nakamura berkata bahawa Grok 4 seolah-olah bermain dengan mentaliti tegang dalam perlawanan akhir - Foto: tangkapan skrin
Sebelum perlawanan, OpenAI membuat kekecohan apabila mengumumkan pelancaran generasi ke-11 LLM, GPT-5.
Walau bagaimanapun, model o3 - ChatGPT yang digunakan dalam perlawanan akhir masih menunjukkan keupayaan inferens yang kuat, dengan purata kadar pergerakan betul sehingga 90.8%, mengatasi sepenuhnya 80.2% Grok 4.
Dalam keempat-empat perlawanan, ChatGPT tidak memberi peluang kepada Grok 4, menyekat lawannya masing-masing selepas 35, 30, 28 dan 54 gerakan.
Menurut Hikaru Nakamura No. 2 dunia , Grok 4 nampaknya bermain dengan lebih ketegangan dan melakukan lebih banyak kesilapan berbanding pusingan sebelumnya. Khususnya, ia kehilangan kepingan dengan mudah - kejadian yang jarang berlaku apabila ia mengalahkan Google Gemini 2.5 Flash dan Gemini 2.5 Pro dengan hebat.
Dengan tiga kemenangan berturut-turut dengan skor 4-0 dan kadar ketepatan purata sehingga 91%, o3 menamatkan kejohanan dengan sempurna.
Walaupun kekuatan o3 tidak dapat dibandingkan dengan grandmaster catur profesional, ia sudah cukup untuk menimbulkan masalah kepada pemain dengan Elo di bawah 2,000. Terutamanya dalam kategori blitz dan super blitz.
Kejohanan anjuran Google itu berakhir dengan penguasaan mutlak wakil Amerika. Walaupun dua model China, Kimi K4 dan DeepSeek, disingkirkan awal, perlawanan tempat ketiga dimenangi oleh Gemini 2.5 Pro mengatasi o4-mini, mengesahkan kedudukan syarikat teknologi terkemuka Amerika.
Acara ini bukan sahaja menunjukkan keupayaan menakjubkan model AI tujuan umum dalam bidang khusus. Ia juga membuka perspektif baharu tentang potensi pembangunan kecerdasan buatan pada masa hadapan.
Walau bagaimanapun, ia juga merupakan peringatan bahawa walaupun LLM sedang berkembang pesat, mereka masih tidak dapat menandingi tahap enjin catur profesional, yang rating Elonya jauh melebihi manusia.
Sumber: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm






Komen (0)