A kínai AI Kimi K2-t kizárták, mert többször is szabálytalan lépéseket tett - Fotó: chess.com
Egy elsöprő, 4-0-s győzelemmel a Gemini 2.5 Pro, az o4-mini, a Grok 4 és az o3 bejutott az AI sakkverseny elődöntőjébe, legyőzve Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash és Kimi k2 csapatait.
A legnevezetesebb negyeddöntőben a Moonshot AI Kimi K2 modellje (Kína) katasztrofális 0-4-es vereséget szenvedett az o3-tól, az OpenAI LLM-jétől - a ChatGPT fejlesztőjétől.
Mind a négy játszma gyorsan, kevesebb mint nyolc lépéssel véget ért, mivel Kimi K2 többször is szabálytalan lépéseket tett.
Például a harmadik játékban, annak ellenére, hogy helyesen értelmezte a pozíciót, amikor o3 hátulról passzolt, Kimi K2 még mindig nem talált egyetlen szabályos lépést sem mind a négy kísérlet során, és kénytelen volt beismerni a vereséget. Az o3 Stockfish eszközével megegyező lépések aránya akár 100% is lehetett, ami azt mutatja, hogy a képességszintek közötti különbség túl nagy volt.
A másik kínai képviselő, a DeepSeek sem járt jobban, 0-4-re kikapott az OpenAI o4-minijétől. Bár az első játszmában jobban teljesítettek honfitársaikhoz képest, mivel megtartották a győzelmet, a DeepSeek továbbra is hibákat vétett, és a következő játszmákban mattot kapott.
A negyeddöntő leglenyűgözőbb karaktere azonban a Grok 4 volt, Elon Musk milliárdos xAI Company-jának modellje. A Grok 4 könnyedén győzte le a Google Gemini 2.5 Flash-ét 4-0-ra. Az ellenfél minden hibáját megbüntetni képes Grok 4 mozdulatpontossága elérte a kör legmagasabb szintjét, körülbelül 97,5%-ot.
A mérkőzést kommentálva Hikaru Nakamura, a világranglista második helyezettje meglepődött: „A Grok 4 kétségtelenül a legerősebb LLM ebben a tornában. A szintkülönbség közte és a többi modell között nem kicsi.”
Ezt a megjegyzést tovább erősítette, amikor Musk úr gyorsan újra megosztotta Nakamura hozzászólásának képét az X közösségi oldalon, a magabiztos megjegyzéssel együtt: „Ez csak egy mellékhatás. Az xAI szinte semmilyen időt nem tölt sakkozással.”
Nakamura sakkozó azt mondta, hogy a Grok 4 teljesen "nem érte el a ligáját" az AI-tornán - Fotó: képernyőkép
A Google oldalán, bár a Gemini 2.5 Flash kiesett, a megmaradt képviselőjük, a Gemini 2.5 Pro meggyőző 4-0-s győzelmet aratott az Anthropic Company Claude 4 Opusa felett, ezzel megerősítve pozícióját a tornán.
Az elődöntőkre augusztus 7-én 0:30-kor (vietnami idő szerint) kerül sor. Az első elődöntő egy magas téttel bíró mérkőzés a Grok 4 és a Gemini 2.5 Pro között. A másik mérkőzés egy drámai "OpenAI derbi" az o3 és az o4-mini között.
TUAN LONG
Forrás: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm






Hozzászólás (0)