AI Kimi K2 aus China wurde wegen wiederholter illegaler Züge disqualifiziert - Foto: chess.com
Mit einem durchschlagenden 4:0-Sieg zogen Gemini 2.5 Pro, o4-mini, Grok 4 und o3 ins Halbfinale des KI-Schachturniers ein und besiegten Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash bzw. Kimi k2.
Im bemerkenswertesten Viertelfinale erlitt das Kimi K2-Modell (China) von Moonshot AI eine katastrophale 0:4-Niederlage gegen o3, LLM von OpenAI – dem Entwickler von ChatGPT.
Alle vier Spiele endeten schnell in weniger als acht Zügen, da Kimi K2 wiederholt illegale Züge machte.
Beispielsweise konnte Kimi K2 im dritten Spiel trotz korrekter Einschätzung der Stellung, als o3 nach hinten checkte, in allen vier Versuchen keinen einzigen legalen Zug finden und musste seine Niederlage eingestehen. Der Prozentsatz der Züge, die mit dem Stockfish-Tool von o3 übereinstimmten, lag bei bis zu 100 %, was zeigt, dass der Unterschied im Können zu groß war.
Dem anderen chinesischen Vertreter, DeepSeek, erging es nicht besser. Er verlor 0:4 gegen o4-mini von OpenAI. Obwohl sie im ersten Spiel besser abschnitten als ihre Landsleute, indem sie durchhielten, machte DeepSeek dennoch Fehler und wurde in den folgenden Spielen schachmatt gesetzt.
Der beeindruckendste Charakter im Viertelfinale war jedoch Grok 4, ein Modell der xAI Company des Milliardärs Elon Musk. Grok 4 besiegte Googles Gemini 2.5 Flash mühelos mit 4:0. Dank seiner Fähigkeit, jeden Fehler des Gegners zu bestrafen, erreichte Grok 4s Bewegungsgenauigkeit mit rund 97,5 % den höchsten Wert der Runde.
Der Weltranglistenzweite Hikaru Nakamura kommentierte das Match überrascht: „Grok 4 ist definitiv das stärkste LLM in diesem Turnier. Der Levelunterschied zu den anderen Modellen ist nicht gering.“
Dieser Kommentar wurde noch verstärkt, als Herr Musk das Bild von Nakamuras Kommentar schnell im sozialen Netzwerk X weiterverbreitete, zusammen mit dem selbstbewussten Kommentar: „Das ist nur ein Nebeneffekt. xAI verbringt fast keine Zeit mit Schach.“
Schachspieler Nakamura sagte, Grok 4 sei beim KI-Turnier völlig „außerhalb seiner Liga“ gewesen – Foto: Screenshot
Auf Seiten von Google schied zwar Gemini 2.5 Flash aus, doch der verbleibende Vertreter, Gemini 2.5 Pro, errang einen überzeugenden 4:0-Sieg über Claude 4 Opus von Anthropic Company und bestätigte damit seine Position im Turnier.
Die Halbfinals finden am 7. August um 0:30 Uhr (Vietnam-Zeit) statt. Das erste Halbfinale ist ein spannendes Match zwischen Grok 4 und Gemini 2.5 Pro. Das zweite Match ist ein dramatisches „OpenAI-Derby“ zwischen o3 und o4-mini.
TUAN LONG
Quelle: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Kommentar (0)