AI Kimi K2 aus China wurde wegen wiederholter illegaler Züge disqualifiziert - Foto: chess.com
Mit einem absoluten 4:0-Sieg sind Gemini 2.5 Pro, o4-mini, Grok 4 und o3 hervorragend ins Halbfinale des KI-Schachturniers eingezogen, nachdem sie Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash bzw. Kimi k2 besiegt hatten.
Im bemerkenswertesten Viertelfinale erlitt das Kimi K2-Modell (China) von Moonshot AI eine katastrophale 0:4-Niederlage gegen o3, LLM von OpenAI – dem Entwickler von ChatGPT.
Alle vier Spiele endeten schnell in weniger als acht Zügen, da Kimi K2 wiederholt illegale Züge machte.
Beispielsweise konnte Kimi K2 in der dritten Partie trotz korrektem Verständnis der Stellung beim Rückchecken von o3 in allen vier Versuchen keinen legalen Zug finden und musste seine Niederlage eingestehen. Der Prozentsatz der Züge, die mit dem Stockfish-Tool von o3 übereinstimmten, lag bei bis zu 100 %, was zeigt, dass der Unterschied im Können zu groß war.
Der andere chinesische Vertreter, DeepSeek, erging es nicht viel besser und verlor 0:4 gegen OpenAIs o4-mini. Obwohl sie im ersten Spiel durchhielten und damit besser abschnitten als ihre Landsleute, machte DeepSeek dennoch Fehler und wurde in den folgenden Spielen schachmatt gesetzt.
Der beeindruckendste Charakter im Viertelfinale war jedoch Grok 4, ein Modell der xAI Company des Milliardärs Elon Musk. Grok 4 besiegte Googles Gemini 2.5 Flash mühelos mit 4:0. Dank seiner Fähigkeit, jeden Fehler des Gegners zu bestrafen, erreichte Grok 4s Bewegungsgenauigkeit mit rund 97,5 % den höchsten Wert der Runde.
Der Weltranglistenzweite Hikaru Nakamura kommentierte das Match überrascht: „Grok 4 ist definitiv das stärkste LLM in diesem Turnier. Der Levelunterschied zu den anderen Modellen ist nicht gering.“
Dieser Kommentar wurde noch verstärkt, als Herr Musk das Bild von Nakamuras Kommentar schnell im sozialen Netzwerk X weiterverbreitete, zusammen mit dem selbstbewussten Kommentar: „Das ist nur ein Nebeneffekt. xAI verbringt fast keine Zeit mit Schach.“
Schachspieler Nakamura sagte, Grok 4 sei beim KI-Turnier völlig „aus dem Spiel“ gewesen – Foto: Screenshot
Auf Seiten von Google schied zwar Gemini 2.5 Flash aus, doch der verbleibende Vertreter, Gemini 2.5 Pro, errang einen überzeugenden 4:0-Sieg über Claude 4 Opus von Anthropic Company und bestätigte damit seine Position im Turnier.
Die Halbfinals finden am 7. August um 0:30 Uhr (Vietnam-Zeit) statt. Das erste Halbfinale ist ein hochkarätiges Duell zwischen Grok 4 und Gemini 2.5 Pro. Das verbleibende Spiel ist ein dramatisches „OpenAI-Derby“ zwischen o3 und o4-mini.
TUAN LONG
Quelle: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Kommentar (0)