Ο AI Kimi K2 από την Κίνα αποκλείστηκε επειδή έκανε επανειλημμένες παράνομες κινήσεις - Φωτογραφία: chess.com
Με μια συντριπτική νίκη με 4-0, οι Gemini 2.5 Pro, o4-mini, Grok 4 και o3 προκρίθηκαν στους ημιτελικούς του τουρνουά σκακιού AI, νικώντας τους Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash και Kimi k2 αντίστοιχα.
Στον πιο αξιοσημείωτο προημιτελικό, το μοντέλο Kimi K2 της Moonshot AI (Κίνα) υπέστη μια καταστροφική ήττα με 0-4 από την o3, LLM της OpenAI - της εταιρείας ανάπτυξης του ChatGPT.
Και τα τέσσερα παιχνίδια τελείωσαν γρήγορα σε λιγότερες από οκτώ κινήσεις, καθώς ο Kimi K2 έκανε επανειλημμένα αντικανονικές κινήσεις.
Για παράδειγμα, στο τρίτο παιχνίδι, παρά το γεγονός ότι κατάλαβε σωστά τη θέση όταν ο o3 έκανε check behind, ο Kimi K2 δεν μπόρεσε να βρει ούτε μία νόμιμη κίνηση και στις τέσσερις προσπάθειες και αναγκάστηκε να παραδεχτεί την ήττα. Το ποσοστό των κινήσεων που ταίριαζαν με το εργαλείο Stockfish του o3 έφτασε το 100%, δείχνοντας ότι η διαφορά στο επίπεδο δεξιοτήτων ήταν πολύ μεγάλη.
Ο άλλος Κινέζος εκπρόσωπος, η DeepSeek, δεν τα πήγε καλύτερα, χάνοντας με 0-4 από την o4-mini της OpenAI. Παρόλο που τα πήγαν καλύτερα από τους συμπατριώτες τους κρατώντας τη θέση τους στο πρώτο παιχνίδι, η DeepSeek έκανε λάθη και έγινε ματ στα επόμενα παιχνίδια.
Ωστόσο, ο πιο εντυπωσιακός χαρακτήρας στους προημιτελικούς ήταν ο Grok 4, ένα μοντέλο από την xAI Company του δισεκατομμυριούχου Elon Musk. Ο Grok 4 νίκησε εύκολα τον Gemini 2.5 Flash της Google με σκορ 4-0. Με την ικανότητα να τιμωρεί κάθε λάθος του αντιπάλου, το ποσοστό ακρίβειας κινήσεων του Grok 4 έφτασε στο υψηλότερο επίπεδο του γύρου, περίπου στο 97,5%.
Σχολιάζοντας τον αγώνα, ο Νο. 2 στον κόσμο παίκτης Hikaru Nakamura εξεπλάγη: «Το Grok 4 είναι σίγουρα το ισχυρότερο LLM σε αυτό το τουρνουά. Η διαφορά επιπέδου μεταξύ αυτού και των άλλων μοντέλων δεν είναι μικρή».
Αυτό το σχόλιο ενισχύθηκε περαιτέρω όταν ο κ. Musk αναδημοσίευσε γρήγορα την εικόνα του σχολίου του Nakamura στο κοινωνικό δίκτυο X, μαζί με το σίγουρο σχόλιο: «Αυτό είναι απλώς μια παρενέργεια. Το xAI δεν αφιερώνει σχεδόν καθόλου χρόνο στο σκάκι».
Ο σκακιστής Nakamura είπε ότι ο Grok 4 ήταν εντελώς «υπερτιμημένος» στο τουρνουά AI - Φωτογραφία: στιγμιότυπο οθόνης
Από την πλευρά της Google, αν και η Gemini 2.5 Flash αποκλείστηκε, η εναπομείνασα εκπρόσωπός της, η Gemini 2.5 Pro, είχε μια πειστική νίκη με 4-0 επί της Claude 4 Opus της Anthropic Company, επιβεβαιώνοντας τη θέση της στο τουρνουά.
Οι ημιτελικοί θα διεξαχθούν στις 00:30 στις 7 Αυγούστου (ώρα Βιετνάμ). Ο πρώτος ημιτελικός είναι ένας αγώνας υψηλού στοιχήματος μεταξύ των Grok 4 και Gemini 2.5 Pro. Ο άλλος αγώνας είναι ένα δραματικό "ντέρμπι OpenAI" μεταξύ των o3 και o4-mini.
ΤΟΥΑΝ ΛΟΝΓΚ
Πηγή: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Σχόλιο (0)