ChatGPT виграє шаховий турнір зі штучним інтелектом

Модель великої мови програмування (LLM) o3 від ChatGPT продемонструвала свою перевагу, перемігши свого конкурента Grok 4 від xAI, заснованого мільярдером Ілоном Маском, з рахунком 4-0 та вигравши чемпіонат з шахів на основі штучного інтелекту.

Báo Tuổi Trẻ•08/08/2025

ChatGPT - Ảnh 1. — Гравець Накамура сказав, що Grok 4, схоже, грав у напруженому настрої у фінальному матчі - Фото: скріншот

Перед матчем OpenAI наробила галасу, оголосивши про запуск 11-го покоління LLM, GPT-5.

Однак, модель o3 - ChatGPT, яка використовувалася у фіналі, все ще демонструвала сильні можливості логічного висновку, із середнім показником правильних переміщень до 90,8%, що повністю перевершує 80,2% у Grok 4.

У всіх чотирьох іграх ChatGPT не дав Гроку 4 жодного шансу, поставивши мат супернику після 35, 30, 28 та 54 ходів відповідно.

За словами другого ракетки світу Хікару Накамури, команда Grok 4, здавалося, грала з більшою напругою та робила більше помилок, ніж у попередніх раундах. Зокрема, вона легко втрачала фігури – рідкісний випадок, коли вона переконливо перемогла Gemini 2.5 Flash та Gemini 2.5 Pro від Google.

З трьома перемогами поспіль з рахунком 4-0 та середнім показником точності до 91%, o3 ідеально завершили турнір.

Хоча силу o3 не можна порівняти з професійними гросмейстерами, її достатньо, щоб створити проблеми гравцям з ЕЛО нижче 2000. Особливо в бліц- та супербліц-категоріях.

Турнір, організований Google, завершився абсолютною домінацією американських представників. У той час як дві китайські моделі, Kimi K4 та DeepSeek, вибули достроково, матч за третє місце виграла Gemini 2.5 Pro над o4-mini, що закріпило позицію провідних американських технологічних компаній.

Ця подія не лише демонструє дивовижні можливості моделей штучного інтелекту загального призначення у спеціалізованій галузі. Вона також відкриває нову перспективу щодо потенціалу розвитку штучного інтелекту в майбутньому.

Однак, це також нагадування про те, що хоча LLM стрімко розвиваються, вони все ще не можуть зрівнятися з рівнем професійних шахових двигунів, чиї рейтинги Ело значно перевищують людські.

ТУАН ЛОНГ

Джерело: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm