OpenAIs AI-modell o3 beseiret Xs Grok 4 med en score på 4-0 i finalen, og vant dermed mesterskapet på Kaggle Game Arena 2025 AI-sjakkutstilling organisert av Google.

Åtte AI-modeller konkurrerer i Kaggle AI Chess Championship 2025. (Kilde: Chess.com)
Grok 4 ble en gang ansett som den sterkeste utfordreren, men gjorde flere alvorlige feil i det siste spillet, som å miste brikker tidlig og gjøre ulogiske trekk.
Grok 3 demonstrerte overlegen taktisk analyse og strategisk forståelse av sjakk, spesielt i mellomspill- og sluttspillsituasjoner. Grok 4, til tross for å være sterk i de tidlige stadiene av turneringen, viste seg svak i de senere partiene og klarte ikke å demonstrere evnen til å håndtere komplekse situasjoner.
På de resterende plassene sikret Googles Gemini 2.5 Pro seg tredjeplassen etter å ha slått o4-mini med en score på 3,5-0,5. Til tross for seieren ble Gemini vurdert til å ha spilt av lavere kvalitet enn o3, med mange rotete spill og feil.
AI Kaggle 2025-konkurransen, som ble avholdt fra 5. til 7. august, samlet åtte store språkmodeller (LLM-er) som konkurrerte i et utslagsformat. De åtte representantene inkluderte o3 og o4-mini fra OpenAI, Grok 4, Gemini 2.5 Pro og Gemini 2.5 Flash fra Google, Claude 4 Opus fra Anthropic, og Deepseek R1 og Kimi R2 fra Kina.
Dette er et Google-testarrangement som har som mål å evaluere potensialet til AI innen strategisk tenkning og generell intelligens.
Kilde: https://vtcnews.vn/openai-o3-vo-dich-giai-co-vua-ai-kaggle-2025-ar958595.html






Kommentar (0)