Model AI o3 dari OpenAI mengalahkan Grok 4 milik X dengan skor 4-0 di final, memenangkan kejuaraan di pameran catur AI Kaggle Game Arena 2025 yang diselenggarakan oleh Google.

Delapan model AI berkompetisi dalam Kejuaraan Catur AI Kaggle 2025. (Sumber: Chess.com)
Grok 4 pernah dianggap sebagai pesaing terkuat, tetapi melakukan beberapa kesalahan serius di pertandingan final, seperti kehilangan bidak di awal permainan dan melakukan langkah-langkah yang tidak logis.
Grok 3 menunjukkan analisis taktis dan pemahaman strategis catur yang unggul, terutama dalam situasi permainan tengah dan akhir. Grok 4, meskipun kuat di tahap awal turnamen, terbukti lemah di pertandingan selanjutnya dan gagal menunjukkan kemampuan untuk menangani situasi yang kompleks.
Di posisi tersisa, Gemini 2.5 Pro dari Google mengamankan tempat ketiga setelah mengalahkan o4-mini dengan skor 3,5-0,5. Meskipun menang, Gemini dinilai memiliki kualitas permainan yang lebih rendah daripada o3, dengan banyak permainan yang berantakan dan kesalahan.
Kompetisi AI Kaggle 2025, yang diadakan pada tanggal 5-7 Agustus, mempertemukan delapan model bahasa besar (LLM) yang berkompetisi dalam format gugur. Kedelapan perwakilan tersebut termasuk o3 dan o4-mini dari OpenAI, Grok 4, Gemini 2.5 Pro dan Gemini 2.5 Flash dari Google, Claude 4 Opus dari Anthropic, serta Deepseek R1 dan Kimi R2 dari Tiongkok.
Ini adalah acara uji coba Google yang bertujuan untuk mengevaluasi potensi AI di bidang pemikiran strategis dan kecerdasan umum.
Sumber: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html






Komentar (0)