Der chinesische KI-Schachspieler Kimi K2 wurde wegen wiederholter Regelverstöße disqualifiziert – Foto: chess.com
Mit einem überzeugenden 4:0-Sieg zogen Gemini 2.5 Pro, o4-mini, Grok 4 und o3 ins Halbfinale des KI-Schachturniers ein und besiegten dabei Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash bzw. Kimi k2.
Im wohl bemerkenswertesten Viertelfinale erlitt das Kimi K2-Modell von Moonshot AI (China) eine desaströse 0:4-Niederlage gegen o3, LLM von OpenAI - dem Entwickler von ChatGPT.
Alle vier Partien endeten schnell nach weniger als acht Zügen, da Kimi K2 wiederholt unzulässige Züge machte.
Beispielsweise konnte Kimi K2 in der dritten Partie, obwohl er die Stellung nach dem Schachgebot von o3 richtig verstand, in allen vier Versuchen keinen einzigen legalen Zug finden und musste aufgeben. Der Anteil der Züge, die mit dem Stockfish-Tool von o3 übereinstimmten, lag bei bis zu 100 %, was den zu großen Unterschied im Spielniveau verdeutlicht.
Der andere chinesische Vertreter, DeepSeek, schnitt nicht besser ab und verlor 0:4 gegen OpenAIs o4-mini. Obwohl sie sich im ersten Spiel besser behaupteten als ihre Landsleute, unterliefen DeepSeek dennoch Fehler, und sie wurden in den folgenden Spielen schachmatt gesetzt.
Der beeindruckendste Charakter im Viertelfinale war jedoch Grok 4, ein Modell von Elon Musks xAI-Firma. Grok 4 besiegte Googles Gemini 2.5 Flash mühelos mit 4:0. Dank seiner Fähigkeit, jeden Fehler des Gegners auszunutzen, erreichte Grok 4s Trefferquote mit rund 97,5 % den höchsten Wert der Runde.
Der Weltranglistenzweite Hikaru Nakamura zeigte sich überrascht über das Spiel: „Grok 4 ist definitiv der stärkste LLM in diesem Turnier. Der Leistungsunterschied zu den anderen Modellen ist nicht gering.“
Dieser Kommentar wurde noch verstärkt, als Herr Musk das Bild von Nakamuras Kommentar im sozialen Netzwerk X schnell erneut teilte, zusammen mit dem selbstsicheren Kommentar: „Das ist nur ein Nebeneffekt. xAI verbringt fast keine Zeit mit Schach.“
Schachspieler Nakamura sagte, Grok 4 sei beim KI-Turnier völlig „nicht sein Niveau“ gewesen – Foto: Screenshot
Auf Seiten von Google schied zwar Gemini 2.5 Flash aus, doch ihr verbleibender Vertreter, Gemini 2.5 Pro, errang einen überzeugenden 4:0-Sieg gegen Claude 4 Opus von Anthropic Company und bestätigte damit seine Position im Turnier.
Die Halbfinals finden am 7. August um 0:30 Uhr (vietnamesischer Zeit) statt. Im ersten Halbfinale treffen Grok 4 und Gemini 2.5 Pro in einem hochkarätigen Duell aufeinander. Das zweite Halbfinale ist ein spannendes „OpenAI-Derby“ zwischen o3 und o4-mini.
TUAN LONG
Quelle: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm






Kommentar (0)