AI Kimi K2 de China fue descalificado por realizar repetidamente movimientos ilegales - Foto: chess.com
Con una contundente victoria de 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 y o3 avanzaron a las semifinales del torneo de ajedrez AI, derrotando a Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash y Kimi k2 respectivamente.
En el cuarto de final más notable, el modelo Kimi K2 de Moonshot AI (China) sufrió una desastrosa derrota 0-4 contra o3, LLM de OpenAI, el desarrollador de ChatGPT.
Las cuatro partidas terminaron rápidamente en menos de ocho movimientos, ya que Kimi K2 realizó repetidamente movimientos ilegales.
Por ejemplo, en la tercera partida, a pesar de comprender correctamente la posición cuando o3 hizo check back, Kimi K2 no pudo encontrar ni una sola jugada legal en sus cuatro intentos, y se vio obligado a admitir la derrota. El porcentaje de jugadas que coincidieron con la herramienta Stockfish de o3 llegó al 100%, lo que demuestra que la diferencia de nivel era demasiado grande.
El otro representante chino, DeepSeek, no tuvo mejor suerte, perdiendo 0-4 contra el o4-mini de OpenAI. Aunque superaron a sus compatriotas al aguantar la primera partida, DeepSeek cometió errores y sufrió jaque mate en las siguientes.
Sin embargo, el personaje más impresionante de los cuartos de final fue Grok 4, un modelo de xAI Company, propiedad del multimillonario Elon Musk. Grok 4 derrotó fácilmente a Gemini 2.5 Flash de Google con un marcador de 4-0. Gracias a su capacidad para castigar cada error del oponente, la precisión de sus movimientos alcanzó el nivel más alto de la ronda, aproximadamente el 97,5 %.
Al comentar sobre el partido, el número 2 del mundo, Hikaru Nakamura, se mostró sorprendido: «Grok 4 es sin duda el LLM más fuerte de este torneo. La diferencia de nivel con los demás modelos es considerable».
Este comentario se reforzó aún más cuando Musk rápidamente volvió a compartir la imagen del comentario de Nakamura en la red social X, junto con el comentario confiado: "Esto es solo un efecto secundario. xAI casi no pasa tiempo en el ajedrez".
El ajedrecista Nakamura dijo que Grok 4 estaba completamente "fuera de su liga" en el torneo de IA - Foto: captura de pantalla
Por el lado de Google, aunque Gemini 2.5 Flash fue eliminado, su representante restante, Gemini 2.5 Pro, tuvo una convincente victoria 4-0 sobre Claude 4 Opus de Anthropic Company, afirmando su posición en el torneo.
Las semifinales se celebrarán a las 0:30 del 7 de agosto (hora de Vietnam). La primera semifinal es un partido de alto riesgo entre Grok 4 y Gemini 2.5 Pro. El otro partido es un emocionante "derbi OpenAI" entre o3 y o4-mini.
TUAN LARGO
Fuente: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm






Kommentar (0)