Google主催のAIチェス展示会「Kaggle Game Arena 2025」の決勝戦で、OpenAIのo3 AIモデルがXのGrok 4を4-0で破り、優勝を果たした。

Kaggle AI チェス チャンピオンシップ 2025 に参加する 8 つの AI モデル。(出典: Chess.com)
Grok 4 はかつて最強候補と考えられていましたが、決勝戦では早い段階で駒を失ったり無理な動きをしたりするなど、多くの重大なミスを犯しました。
o3は、特に中盤と終盤において、優れた戦術分析とチェス戦略の理解力を示しました。Grok 4は、トーナメント序盤は好調でしたが、終盤では弱点を見せ、複雑な状況に対処する能力を発揮できませんでした。
一方、GoogleのGemini 2.5 Proはo4-mini 3.5-0.5に勝利し、3位を獲得しました。勝利したものの、Geminiはo3よりも質が低く、混乱やエラーが発生しやすいゲームが多かったと評価されました。
Kaggle AI Challenge 2025は8月5日から7日にかけて開催され、8つの大規模言語モデル(LLM)がシングルエリミネーション方式で競い合いました。代表8名は、OpenAIのo3とo4-mini、GoogleのGrok 4、Gemini 2.5 Pro、Gemini 2.5 Flash、AnthropicのClaude 4 Opus、そして中国のDeepseek R1とKimi R2でした。
これは、戦略的思考と一般知能の分野における AI の可能性を評価するための Google の実験です。
出典: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html
コメント (0)