ИИ Кими К2 из Китая был дисквалифицирован за неоднократное совершение незаконных ходов - Фото: chess.com
Одержав убедительную победу со счетом 4:0, Gemini 2.5 Pro, o4-mini, Grok 4 и o3 вышли в полуфинал турнира по шахматам под управлением ИИ, победив Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash и Kimi k2 соответственно.
В самом примечательном четвертьфинале модель Kimi K2 от Moonshot AI (Китай) потерпела катастрофическое поражение со счетом 0-4 от o3, LLM от OpenAI — разработчика ChatGPT.
Все четыре партии завершились быстро, менее чем за восемь ходов, поскольку Кими К2 неоднократно делал запрещённые ходы.
Например, в третьей партии, несмотря на правильное понимание позиции после того, как o3 сделал чек в ответ, Кими K2 так и не смог найти ни одного возможного хода во всех четырёх попытках и был вынужден признать поражение. Процент ходов, совпавших с инструментом Stockfish o3, достигал 100%, что свидетельствовало о слишком большой разнице в уровне мастерства.
Другой представитель Китая, DeepSeek, выступил не лучше, проиграв команде o4-mini от OpenAI со счётом 0:4. Хотя в первой партии они выступили лучше своих соотечественников, удержав преимущество, DeepSeek всё же допустил ошибки и получил мат в следующих партиях.
Однако самым впечатляющим персонажем четвертьфинала стал Grok 4, робот от компании xAI Company миллиардера Илона Маска. Grok 4 легко победил Gemini 2.5 Flash от Google со счётом 4:0. Благодаря способности наказывать соперника за каждую ошибку, точность приёмов Grok 4 достигла наивысшего значения в раунде — около 97,5%.
Комментируя матч, второй номер мирового рейтинга Хикару Накамура был удивлён: «Grok 4 — определённо сильнейший LLM на этом турнире. Разрыв в уровне между ним и другими моделями немалый».
Этот комментарий получил дальнейшее подтверждение, когда г-н Маск быстро опубликовал изображение комментария Накамуры в социальной сети X вместе с уверенным комментарием: «Это всего лишь побочный эффект. xAI почти не тратит время на шахматы».
Шахматист Накамура заявил, что Grok 4 был совершенно «не в его лиге» на турнире ИИ — Фото: скриншот
Что касается Google, то, хотя Gemini 2.5 Flash и выбыл, их оставшийся представитель, Gemini 2.5 Pro, одержал убедительную победу со счетом 4:0 над Claude 4 Opus из Anthropic Company, подтвердив свои позиции на турнире.
Полуфиналы состоятся 7 августа в 0:30 по вьетнамскому времени. Первый полуфинал — это напряженный матч между Grok 4 и Gemini 2.5 Pro. Второй матч — драматичная битва OpenAI между o3 и o4-mini.
ТУАН ЛОНГ
Источник: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Комментарий (0)