L'IA Kimi K2 de Chine a été disqualifiée pour avoir effectué des coups illégaux à plusieurs reprises. Photo : chess.com
Avec une victoire retentissante 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 et o3 se sont qualifiés pour les demi-finales du tournoi d'échecs AI, battant respectivement Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash et Kimi k2.
Lors du quart de finale le plus notable, le modèle Kimi K2 de Moonshot AI (Chine) a subi une défaite désastreuse 0-4 contre o3, LLM d'OpenAI - le développeur de ChatGPT.
Les quatre parties se sont terminées rapidement en moins de huit coups, car Kimi K2 a effectué à plusieurs reprises des mouvements illégaux.
Par exemple, lors de la troisième partie, malgré une bonne compréhension de la position lors du check back d'o3, Kimi K2 n'a pas réussi à trouver un seul coup valide en quatre tentatives et a dû concéder sa défaite. Le pourcentage de coups correspondant à l'outil Stockfish d'o3 a atteint 100 %, ce qui montre que la différence de niveau était trop importante.
L'autre représentant chinois, DeepSeek, n'a pas fait mieux, s'inclinant 0-4 face à o4-mini d'OpenAI. Bien qu'ils aient mieux résisté que leurs compatriotes lors de la première partie, DeepSeek a commis des erreurs et a été mis échec et mat lors des parties suivantes.
Cependant, le personnage le plus impressionnant des quarts de finale était Grok 4, un modèle de la société xAI du milliardaire Elon Musk. Grok 4 a facilement battu Gemini 2.5 Flash de Google sur le score de 4 à 0. Capable de punir chaque erreur de son adversaire, la précision de ses mouvements a atteint le niveau le plus élevé de la manche, soit environ 97,5 %.
Commentant le match, Hikaru Nakamura, numéro 2 mondial , s'est dit surpris : « Grok 4 est sans aucun doute le LLM le plus fort de ce tournoi. L'écart de niveau avec les autres modèles est considérable. »
Ce commentaire a été encore renforcé lorsque M. Musk a rapidement repartagé l'image du commentaire de Nakamura sur le réseau social X, accompagné du commentaire confiant : « Ce n'est qu'un effet secondaire. xAI ne passe presque pas de temps aux échecs. »
Le joueur d'échecs Nakamura a déclaré que Grok 4 était complètement « hors de sa portée » lors du tournoi d'IA - Photo : capture d'écran
Du côté de Google, bien que Gemini 2.5 Flash ait été éliminé, son représentant restant, Gemini 2.5 Pro, a remporté une victoire convaincante 4-0 sur Claude 4 Opus d'Anthropic Company, affirmant sa position dans le tournoi.
Les demi-finales auront lieu le 7 août à 0h30 (heure du Vietnam). La première demi-finale est un match à enjeux élevés entre Grok 4 et Gemini 2.5 Pro. L'autre match est un « derby OpenAI » palpitant entre o3 et o4-mini.
TUAN LONG
Source : https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Comment (0)