ChatGPT побеждает в чемпионате по шахматам среди ИИ

ChatGPT - Ảnh 1. — Игрок Накамура сказал, что Grok 4, похоже, играл с напряженным настроем в финальном матче - Фото: скриншот

Перед матчем OpenAI произвела фурор, объявив о запуске 11-го поколения LLM, GPT-5.

Однако модель o3 - ChatGPT, использованная в финале, по-прежнему демонстрировала высокие возможности вывода со средней частотой правильных ходов до 90,8%, что полностью превосходит показатель Grok 4 в 80,2%.

Во всех четырех играх ChatGPT не дал Grok 4 ни единого шанса, поставив мат своему оппоненту после 35, 30, 28 и 54 ходов соответственно.

По словам второй ракетки мира Хикару Накамуры, Grok 4, похоже, играл с большим напряжением и допускал больше ошибок, чем в предыдущих раундах. В частности, он легко терял фигуры — редкое явление после сокрушительной победы над Gemini 2.5 Flash и Gemini 2.5 Pro от Google.

Одержав три победы подряд со счетом 4-0 и средней точностью до 91%, o3 идеально завершила турнир.

Хотя силу o3 нельзя сравнить с профессиональными гроссмейстерами, её достаточно, чтобы создать проблемы игрокам с рейтингом Эло ниже 2000. Особенно в категориях «блиц» и «суперблиц».

Турнир, организованный Google, завершился абсолютным доминированием американских представителей. Хотя две китайские модели, Kimi K4 и DeepSeek, выбыли на ранних этапах, в матче за третье место Gemini 2.5 Pro одержал победу над o4-mini, что подтвердило позиции ведущих американских технологических компаний.

Это мероприятие не только демонстрирует удивительные возможности универсальных моделей ИИ в специализированной области, но и открывает новый взгляд на потенциал развития искусственного интеллекта в будущем.

Однако это также напоминание о том, что, хотя программы LLM быстро развиваются, они все еще не могут сравниться по уровню с профессиональными шахматными движками, рейтинги Эло которых значительно превышают человеческие.

ТУАН ЛОНГ

Источник: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm

Тема: Близнецы шахматы

Комментарий (0)