ИИ Кими К2 из Китая был дисквалифицирован за неоднократное совершение незаконных ходов - Фото: chess.com
Одержав абсолютную победу со счетом 4-0, Gemini 2.5 Pro, o4-mini, Grok 4 и o3 уверенно вышли в полуфинал турнира по шахматам среди ИИ, одержав победы над Claude 4 Opus, DeepSeek R1, Gemini 2.5 Flash и Kimi k2 соответственно.
В самом примечательном четвертьфинале модель Kimi K2 от Moonshot AI (Китай) потерпела катастрофическое поражение со счетом 0-4 от o3, LLM от OpenAI — разработчика ChatGPT.
Все четыре партии завершились быстро, менее чем за восемь ходов, поскольку Кими К2 неоднократно делал запрещённые ходы.
Например, в третьей партии, несмотря на правильное понимание позиции после того, как o3 сделал ответный чек, Кими K2 так и не смог найти допустимый ход во всех четырёх попытках и был вынужден признать поражение. Процент ходов, совпавших с инструментом Stockfish o3, достигал 100%, что свидетельствует о слишком большой разнице в уровне мастерства.
Другой представитель Китая, DeepSeek, выступил не намного лучше, проиграв команде o4-mini от OpenAI со счётом 0:4. Хотя они и выступили лучше своих соотечественников, выстояв в первой партии, DeepSeek всё же допустил ошибки и получил мат в следующих партиях.
Однако самым впечатляющим персонажем четвертьфинала стал Grok 4, робот от компании xAI Company миллиардера Илона Маска. Grok 4 легко победил Gemini 2.5 Flash от Google со счётом 4:0. Благодаря способности наказывать соперника за каждую ошибку, точность приёмов Grok 4 достигла наивысшего значения в раунде — около 97,5%.
Комментируя матч, второй номер мирового рейтинга Хикару Накамура был удивлён: «Grok 4 — определённо сильнейший LLM на этом турнире. Разрыв в уровне между ним и другими моделями немалый».
Этот комментарий был подкреплен, когда г-н Маск быстро опубликовал изображение комментария Накамуры в социальной сети X вместе с уверенным комментарием: «Это всего лишь побочный эффект. xAI почти не тратит время на шахматы».
Шахматист Накамура заявил, что Grok 4 был полностью «вне игры» на турнире ИИ. Фото: скриншот
Что касается Google, то, хотя Gemini 2.5 Flash и выбыл, их оставшийся представитель, Gemini 2.5 Pro, одержал убедительную победу со счетом 4:0 над Claude 4 Opus из Anthropic Company, подтвердив свои позиции на турнире.
Полуфиналы состоятся 7 августа в 0:30 по вьетнамскому времени. Первый полуфинал — это высокоуровневое противостояние между Grok 4 и Gemini 2.5 Pro. Оставшийся матч — драматичное «дерби OpenAI» между o3 и o4-mini.
ТУАН ЛОНГ
Источник: https://tuoitre.vn/my-thang-tuyet-doi-tai-giai-co-vua-danh-cho-ai-20250806111234074.htm
Комментарий (0)