AI Kimi K2 de China fue descalificado por realizar repetidamente movimientos ilegales - Foto: chess.com
Con una victoria absoluta de 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 y o3 han avanzado excelentemente a las semifinales del torneo de ajedrez AI, después de derrotar a Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash y Kimi k2 respectivamente.
En el cuarto de final más notable, el modelo Kimi K2 de Moonshot AI (China) sufrió una desastrosa derrota 0-4 contra o3, LLM de OpenAI, el desarrollador de ChatGPT.
Las cuatro partidas terminaron rápidamente en menos de ocho movimientos, ya que Kimi K2 realizó repetidamente movimientos ilegales.
Por ejemplo, en la tercera partida, a pesar de comprender correctamente la posición cuando o3 retrocedió, Kimi K2 siguió sin encontrar una jugada válida en sus cuatro intentos, y se vio obligado a admitir la derrota. El porcentaje de jugadas que coincidieron con la herramienta Stockfish de o3 llegó al 100%, lo que demuestra que la diferencia de nivel era demasiado grande.
El otro representante chino, DeepSeek, no tuvo mucho mejor suerte, perdiendo 0-4 contra el o4-mini de OpenAI. Aunque superaron a sus compatriotas al resistir en la primera partida, DeepSeek cometió errores y sufrió jaque mate en las siguientes.
Sin embargo, el personaje más impresionante de los cuartos de final fue Grok 4, un modelo de xAI Company, propiedad del multimillonario Elon Musk. Grok 4 derrotó fácilmente a Gemini 2.5 Flash de Google con un marcador de 4-0. Gracias a su capacidad para castigar cada error del oponente, la precisión de sus movimientos alcanzó el nivel más alto de la ronda, aproximadamente el 97,5%.
Al comentar sobre el partido, el número 2 del mundo, Hikaru Nakamura, se mostró sorprendido: «Grok 4 es sin duda el LLM más fuerte de este torneo. La diferencia de nivel con los demás modelos es considerable».
Este comentario se vio reforzado cuando Musk rápidamente volvió a compartir la imagen del comentario de Nakamura en la red social X, junto con el siguiente comentario: "Esto es solo un efecto secundario. xAI casi no dedica tiempo al ajedrez".
El ajedrecista Nakamura afirmó que Grok 4 quedó completamente "fuera de juego" en el torneo de IA - Foto: captura de pantalla
Por el lado de Google, aunque Gemini 2.5 Flash fue eliminado, su representante restante, Gemini 2.5 Pro, tuvo una convincente victoria 4-0 sobre Claude 4 Opus de Anthropic Company, afirmando su posición en el torneo.
Las semifinales se celebrarán a las 0:30 del 7 de agosto (hora de Vietnam). La primera semifinal es un enfrentamiento de alto nivel entre Grok 4 y Gemini 2.5 Pro. El partido restante es un emocionante "derbi OpenAI" entre o3 y o4-mini.
TUAN LARGO
Fuente: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Kommentar (0)