Le joueur chinois AI Kimi K2 a été disqualifié pour avoir effectué des coups illégaux à plusieurs reprises. Photo : chess.com
Avec une victoire absolue 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 et o3 se sont parfaitement qualifiés pour les demi-finales du tournoi d'échecs AI, après avoir battu respectivement Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash et Kimi k2.
Lors du quart de finale le plus notable, le modèle Kimi K2 de Moonshot AI (Chine) a subi une défaite désastreuse 0-4 contre o3, LLM d'OpenAI - le développeur de ChatGPT.
Les quatre parties se sont terminées rapidement en moins de huit coups, car Kimi K2 a effectué à plusieurs reprises des mouvements illégaux.
Par exemple, lors de la troisième partie, malgré une bonne compréhension de la position lors du check back d'o3, Kimi K2 n'a pas réussi à trouver un coup légal lors de ses quatre tentatives et a été contraint d'accepter la défaite. Le pourcentage de coups correspondant à l'outil Stockfish d'o3 a atteint 100 %, ce qui montre que la différence de niveau était trop importante.
L'autre représentant chinois, DeepSeek, n'a pas fait beaucoup mieux, s'inclinant 0-4 face à o4-mini d'OpenAI. Bien qu'ils aient mieux résisté à leurs compatriotes lors de la première partie, DeepSeek a commis des erreurs et a été mis échec et mat lors des parties suivantes.
Cependant, le personnage le plus impressionnant des quarts de finale a été Grok 4, un modèle de la société xAI du milliardaire Elon Musk. Grok 4 a facilement battu Gemini 2.5 Flash de Google sur le score de 4 à 0. Capable de punir chaque erreur de son adversaire, la précision des mouvements de Grok 4 a atteint le niveau le plus élevé du tour, soit environ 97,5 %.
Commentant le match, Hikaru Nakamura, numéro 2 mondial , s'est dit surpris : « Grok 4 est sans aucun doute le LLM le plus fort de ce tournoi. L'écart de niveau avec les autres modèles est considérable. »
Ce commentaire a été renforcé lorsque M. Musk a rapidement repartagé l'image du commentaire de Nakamura sur le réseau social X, accompagné du commentaire confiant : « Ce n'est qu'un effet secondaire. xAI ne passe presque pas de temps aux échecs. »
Le joueur d'échecs Nakamura a déclaré que Grok 4 était complètement « hors jeu » lors du tournoi d'IA - Photo : capture d'écran
Du côté de Google, bien que Gemini 2.5 Flash ait été éliminé, son représentant restant, Gemini 2.5 Pro, a remporté une victoire convaincante 4-0 sur Claude 4 Opus d'Anthropic Company, affirmant sa position dans le tournoi.
Les demi-finales auront lieu le 7 août à 0h30 (heure du Vietnam). La première demi-finale sera une confrontation de haut niveau entre Grok 4 et Gemini 2.5 Pro. Le match suivant sera un « derby OpenAI » spectaculaire entre o3 et o4-mini.
TUAN LONG
Source : https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Comment (0)