ШІ Кімі К2 з Китаю був дискваліфікований за неодноразові недозволені ходи - Фото: chess.com
Здобувши переконливу перемогу з рахунком 4:0, Gemini 2.5 Pro, o4-mini, Grok 4 та o3 вийшли до півфіналу шахового турніру зі штучного інтелекту, перемігши Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash та Kimi k2 відповідно.
У найпомітнішому чвертьфіналі модель Kimi K2 (Китай) від Moonshot AI зазнала катастрофічної поразки з рахунком 0-4 від o3, LLM OpenAI - розробника ChatGPT.
Усі чотири партії завершилися швидко, менш ніж за вісім ходів, оскільки Кімі К2 неодноразово робив заборонені ходи.
Наприклад, у третій партії, незважаючи на правильне розуміння позиції, коли o3 зробив шах позаду, Кімі К2 все одно не зміг знайти жодного легального ходу з усіх чотирьох спроб і був змушений визнати поразку. Відсоток ходів, що збігалися з інструментом o3 "Stockfish", сягав 100%, що показує, що різниця в рівні майстерності була занадто великою.
Інший китайський представник, DeepSeek, не виступив краще, програвши команді OpenAI o4-mini з рахунком 0-4. Хоча вони виступили краще за своїх співвітчизників, втримавшись у першій партії, DeepSeek все ж таки припустилися помилок і отримали мат у наступних іграх.
Однак, найвражаючим персонажем у чвертьфіналі став Grok 4, модель з компанії xAI мільярдера Ілона Маска. Grok 4 легко переміг Gemini 2.5 Flash від Google з рахунком 4-0. Завдяки здатності карати за кожну помилку суперника, коефіцієнт точності рухів Grok 4 досяг найвищого рівня в раунді, приблизно 97,5%.
Коментуючи матч, гравець №2 у світі Хікару Накамура був здивований: «Grok 4 – це безумовно найсильніший LLM у цьому турнірі. Різниця в рівні між ним та іншими моделями не мала».
Цей коментар був ще більше підтверджений, коли пан Маск швидко повторно опублікував зображення коментаря Накамури в соціальній мережі X разом із впевненим коментарем: «Це лише побічний ефект. xAI майже не витрачає часу на шахи».
Шахіст Накамура сказав, що Грок 4 був абсолютно "не на своєму рівні" на турнірі зі штучного інтелекту - Фото: скріншот
З боку Google, хоча Gemini 2.5 Flash вибула, їхній представник, Gemini 2.5 Pro, здобув переконливу перемогу з рахунком 4:0 над Claude 4 Opus з Anthropic Company, підтвердивши свою позицію в турнірі.
Півфінали відбудуться о 00:30 7 серпня (за в'єтнамським часом). Перший півфінал — це матч з високими ставками між Grok 4 та Gemini 2.5 Pro. Інший матч — це драматичне «дербі OpenAI» між o3 та o4-mini.
ТУАН ЛОНГ
Джерело: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Коментар (0)