โมเดล AI o3 ของ OpenAI เอาชนะ Grok 4 ของ X ด้วยคะแนน 4-0 ในรอบชิงชนะเลิศ คว้าแชมป์ในการแข่งขันหมากรุก AI Kaggle Game Arena 2025 ที่จัดโดย Google

มีโมเดล AI จำนวน 8 โมเดลเข้าร่วมแข่งขันในรายการ Kaggle AI Chess Championship 2025 (ที่มา: Chess.com)
Grok 4 เคยถูกมองว่าเป็นผู้เข้าแข่งขันที่แข็งแกร่งที่สุด แต่กลับทำผิดพลาดร้ายแรงหลายครั้งในเกมสุดท้าย เช่น เสียตัวหมากตั้งแต่ต้นเกม และเดินหมากที่ไม่สมเหตุสมผล
Grok 3 แสดงให้เห็นถึงการวิเคราะห์เชิงยุทธวิธีและความเข้าใจเชิงกลยุทธ์ที่เหนือกว่าในเกมหมากรุก โดยเฉพาะอย่างยิ่งในสถานการณ์ช่วงกลางเกมและช่วงท้ายเกม ในขณะที่ Grok 4 แม้จะแข็งแกร่งในช่วงต้นของการแข่งขัน แต่ก็พิสูจน์แล้วว่าอ่อนแอในเกมหลังๆ และไม่สามารถแสดงให้เห็นถึงความสามารถในการรับมือกับสถานการณ์ที่ซับซ้อนได้
ในตำแหน่งที่เหลือ Google Gemini 2.5 Pro คว้าอันดับสามไปครองหลังจากเอาชนะ o4-mini ด้วยคะแนน 3.5-0.5 แม้จะชนะ แต่ Gemini ก็ถูกตัดสินว่ามีคุณภาพการเล่นต่ำกว่า o3 โดยมีเกมที่เล่นไม่เป็นระเบียบและมีข้อผิดพลาดมากมาย
การแข่งขัน AI Kaggle 2025 ซึ่งจัดขึ้นระหว่างวันที่ 5-7 สิงหาคม ได้รวบรวมโมเดลภาษาขนาดใหญ่ (LLM) จำนวน 8 โมเดลมาแข่งขันกันในรูปแบบน็อกเอาต์ โดยตัวแทนทั้ง 8 โมเดล ได้แก่ o3 และ o4-mini จาก OpenAI, Grok 4, Gemini 2.5 Pro และ Gemini 2.5 Flash จาก Google, Claude 4 Opus จาก Anthropic และ Deepseek R1 และ Kimi R2 จากประเทศจีน
นี่คืองานทดสอบของ Google ที่มุ่งประเมินศักยภาพของ AI ในด้านการคิดเชิงกลยุทธ์และความฉลาดทั่วไป
ที่มา: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html






การแสดงความคิดเห็น (0)