Το μοντέλο τεχνητής νοημοσύνης o3 της OpenAI νίκησε το Grok 4 της X με σκορ 4-0 στον τελικό, κατακτώντας το πρωτάθλημα στην έκθεση σκακιού τεχνητής νοημοσύνης Kaggle Game Arena 2025 που διοργάνωσε η Google.

Οκτώ μοντέλα τεχνητής νοημοσύνης αγωνίζονται στο Kaggle AI Chess Championship 2025. (Πηγή: Chess.com)
Ο Grok 4 κάποτε θεωρούνταν ο ισχυρότερος αντίπαλος, αλλά έκανε αρκετά σοβαρά λάθη στο τελικό παιχνίδι, όπως το να χάσει κομμάτια νωρίς και να κάνει παράλογες κινήσεις.
Ο Grok 3 επέδειξε ανώτερη τακτική ανάλυση και στρατηγική κατανόηση του σκακιού, ιδιαίτερα σε καταστάσεις middlegame και endgame. Ο Grok 4, παρά το γεγονός ότι ήταν δυνατός στα αρχικά στάδια του τουρνουά, αποδείχθηκε αδύναμος στα μεταγενέστερα παιχνίδια και απέτυχε να επιδείξει την ικανότητα να χειρίζεται πολύπλοκες καταστάσεις.
Στις υπόλοιπες θέσεις, το Gemini 2.5 Pro της Google εξασφάλισε την τρίτη θέση αφού νίκησε το o4-mini με σκορ 3,5-0,5. Παρά τη νίκη, το Gemini κρίθηκε ότι έπαιξε χαμηλότερης ποιότητας από το o3, με πολλά ακατάστατα παιχνίδια και λάθη.
Ο διαγωνισμός AI Kaggle 2025, που πραγματοποιήθηκε από τις 5 έως τις 7 Αυγούστου, συγκέντρωσε οκτώ μεγάλα γλωσσικά μοντέλα (LLM) που διαγωνίστηκαν σε μορφή knockout. Οι οκτώ εκπρόσωποι περιλάμβαναν τα o3 και o4-mini από την OpenAI, τα Grok 4, Gemini 2.5 Pro και Gemini 2.5 Flash από την Google, το Claude 4 Opus από την Anthropic και τα Deepseek R1 και Kimi R2 από την Κίνα.
Πρόκειται για μια δοκιμαστική εκδήλωση της Google που στοχεύει στην αξιολόγηση των δυνατοτήτων της Τεχνητής Νοημοσύνης στους τομείς της στρατηγικής σκέψης και της γενικής νοημοσύνης.
Πηγή: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html






Σχόλιο (0)