中国のAIキミK2選手は、繰り返し不正な動きをしたため失格となった - 写真:chess.com
Gemini 2.5 Pro、o4-mini、Grok 4、o3は4対0の圧倒的勝利で、それぞれClaude 4 Opus、DeepSeek R1、Gemini 2.5 Flash、Kimi k2を破り、AIチェストーナメントの準決勝に進出しました。
最も注目された準々決勝では、Moonshot AI の Kimi K2 モデル (中国) が、ChatGPT の開発元である OpenAI の LLM である o3 に対して 0-4 で惨敗しました。
キミ・K2 が繰り返し違法な動きをしたため、4 つのゲームはすべて 8 手以内に終了しました。
例えば、第3局では、o3がチェックビハインドした際にKimi K2は局面を正しく理解していたにもかかわらず、4回の試行全てで有効な手を見つけることができず、敗北を認めざるを得ませんでした。o3のStockfishツールと一致した手の割合は100%に達し、スキルレベルの差があまりにも大きかったことが示されました。
もう一方の中国代表チーム、DeepSeekもOpenAIのo4-miniに0-4で敗れ、苦戦を強いられました。第1ゲームを粘り強く戦い、中国チームよりも良い結果を残しましたが、DeepSeekはミスを犯し、その後のゲームでは完封負けを喫しました。
しかし、準々決勝で最も印象的だったのは、億万長者のイーロン・マスク氏が率いるxAIカンパニーのモデル、Grok 4でした。Grok 4はGoogleのGemini 2.5 Flashを4-0で圧倒しました。相手のあらゆるミスを見逃さない能力を持つGrok 4の技の精度は、このラウンドで最高レベルの約97.5%に達しました。
世界ランキング2位のヒカル・ナカムラ選手は試合後、驚きのコメントを述べた。「Grok 4は間違いなくこの大会で最強のLLMです。他の機種とのレベル差は小さくありません。」
このコメントは、マスク氏がソーシャルネットワークXで中村氏のコメントの画像をすぐに再シェアし、「これは単なる副作用だ。xAIはチェスにほとんど時間を費やしていない」という自信に満ちたコメントを添えたことで、さらに強化された。
チェスプレイヤーの中村氏は、AIトーナメントでGrok 4は完全に「自分の力を超えている」と語った - 写真:スクリーンショット
Google 側では、Gemini 2.5 Flash は敗退したものの、残った代表チームである Gemini 2.5 Pro が Anthropic Company の Claude 4 Opus に 4-0 で圧勝し、トーナメントでの地位を固めました。
準決勝は8月7日午前0時30分(ベトナム時間)に行われます。最初の準決勝は、Grok 4とGemini 2.5 Proによるハイステークスマッチです。もう1つの試合は、o3とo4-miniによるドラマチックな「OpenAIダービー」です。
トゥアン・ロン
出典: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
コメント (0)