США виграють шаховий турнір зі штучним інтелектом.

Шахи для ШІ - Фото 1.

ШІ Кімі К2 з Китаю був дискваліфікований за неодноразові недозволені ходи - Фото: chess.com

Здобувши переконливу перемогу з рахунком 4:0, Gemini 2.5 Pro, o4-mini, Grok 4 та o3 вийшли до півфіналу шахового турніру зі штучного інтелекту, перемігши Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash та Kimi k2 відповідно.

У найпомітнішому чвертьфіналі модель Kimi K2 (Китай) від Moonshot AI зазнала катастрофічної поразки з рахунком 0-4 від o3, LLM OpenAI - розробника ChatGPT.

Усі чотири партії завершилися швидко, менш ніж за вісім ходів, оскільки Кімі К2 неодноразово робив заборонені ходи.

Наприклад, у третій партії, незважаючи на правильне розуміння позиції, коли o3 зробив шах позаду, Кімі К2 все одно не зміг знайти жодного легального ходу з усіх чотирьох спроб і був змушений визнати поразку. Відсоток ходів, що збігалися з інструментом o3 "Stockfish", сягав 100%, що показує, що різниця в рівні майстерності була занадто великою.

Інший китайський представник, DeepSeek, не виступив краще, програвши команді OpenAI o4-mini з рахунком 0-4. Хоча вони виступили краще за своїх співвітчизників, втримавшись у першій партії, DeepSeek все ж таки припустилися помилок і отримали мат у наступних іграх.

Однак, найвражаючим персонажем у чвертьфіналі став Grok 4, модель з компанії xAI мільярдера Ілона Маска. Grok 4 легко переміг Gemini 2.5 Flash від Google з рахунком 4-0. Завдяки здатності карати за кожну помилку суперника, коефіцієнт точності рухів Grok 4 досяг найвищого рівня в раунді, приблизно 97,5%.

Коментуючи матч, гравець №2 у світі Хікару Накамура був здивований: «Grok 4 – це безумовно найсильніший LLM у цьому турнірі. Різниця в рівні між ним та іншими моделями не мала».

Цей коментар був ще більше підтверджений, коли пан Маск швидко повторно опублікував зображення коментаря Накамури в соціальній мережі X разом із впевненим коментарем: «Це лише побічний ефект. xAI майже не витрачає часу на шахи».

Шахи для ШІ - Фото 2.

Шахіст Накамура сказав, що Грок 4 був абсолютно "не на своєму рівні" на турнірі зі штучного інтелекту - Фото: скріншот

З боку Google, хоча Gemini 2.5 Flash вибула, їхній представник, Gemini 2.5 Pro, здобув переконливу перемогу з рахунком 4:0 над Claude 4 Opus з Anthropic Company, підтвердивши свою позицію в турнірі.

Півфінали відбудуться о 00:30 7 серпня (за в'єтнамським часом). Перший півфінал — це матч з високими ставками між Grok 4 та Gemini 2.5 Pro. Інший матч — це драматичне «дербі OpenAI» між o3 та o4-mini.

ТУАН ЛОНГ

Джерело: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm