Игрок Накамура сказал, что Grok 4, похоже, играл с напряженным настроем в финальном матче - Фото: скриншот
Перед матчем OpenAI произвела фурор, объявив о запуске своего LLM 11-го поколения — GPT-5.
Однако модель o3 - ChatGPT, использованная в финале, все равно продемонстрировала высокую способность к рассуждению, со средней частотой правильных ходов до 90,8%, что полностью превзошло показатель Grok 4 в 80,2%.
Во всех четырех играх ChatGPT не дал Grok 4 ни единого шанса, поставив мат своему оппоненту после 35, 30, 28 и 54 ходов соответственно.
По словам второй ракетки мира Хикару Накамуры, Grok 4, похоже, играл с большим напряжением и допускал больше ошибок, чем в предыдущих раундах. В частности, он легко терял фигуры — редкое явление после сокрушительной победы над Gemini 2.5 Flash и Gemini 2.5 Pro от Google.
Одержав три победы подряд со счетом 4-0 и средней точностью до 91%, o3 идеально завершила турнир.
Хотя мощь o3 не сравнима с мощью профессиональных гроссмейстеров, её достаточно, чтобы создать трудности игрокам с Эло ниже 2000. Особенно в категориях «блиц» и «суперблиц».
Турнир, организованный Google, завершился абсолютным доминированием американских представителей. Хотя две китайские модели, Kimi K4 и DeepSeek, выбыли на ранних этапах, в матче за третье место Gemini 2.5 Pro одержал победу над o4-mini, что подтвердило позиции ведущих американских технологических компаний.
Это мероприятие не только демонстрирует удивительные возможности универсальных моделей искусственного интеллекта в специализированной области, но и открывает новые перспективы развития искусственного интеллекта в будущем.
Однако это также напоминание о том, что, хотя программы LLM быстро развиваются, они все еще не могут сравниться по уровню с профессиональными шахматными движками, рейтинги Эло которых значительно превышают человеческие.
Источник: https://tuoitre.vn/chatgpt-dang-quang-giai-co-vua-danh-cho-ai-20250808090405997.htm
Комментарий (0)