Исследование было опубликовано 17 января в журнале Nature — престижном научном журнале, существующем уже более 150 лет.
Основными авторами AlphaGeometry являются Чинь Хоанг Чиеу, 29 лет, аспирант Нью-Йоркского университета, и Лыонг Минь Тханг, 36 лет, аспирант Стэнфордского университета (США). Вместе с Чиеу и Тхангом работают ещё три учёных, в том числе 42-летний доктор Ле Вьет Куок, известный как «гений искусственного интеллекта» в Google. Доктор Куок и Тханг также являются старшими экспертами Google DeepMind, исследовательского подразделения Google в области искусственного интеллекта (ИИ).
На Международной математической олимпиаде (ММО) 2000-2022 годов AlphaGeometry решила 25 задач по геометрии за отведённое время, предыдущая продвинутая система решила всего 10 задач, а золотой медалист ММО в среднем решил 25,9 задач.
По данным Google, в каждой олимпиаде 6 задач, обычно 2 из которых — геометрические, поэтому AlphaGeometry может справиться лишь с 1/3. Если рассматривать только геометрию, этот ИИ находится на уровне золотых медалистов IMO. Если же учесть общее количество задач, то это первая в мире модель ИИ, способная преодолеть порог бронзовых медалей IMO 2000 и 2015.
Многие эксперты в области искусственного интеллекта и математики считают это впечатляющим результатом.
«Исследователям ИИ вполне логично попробовать свои силы в решении геометрических задач ИМО, потому что поиск их решений немного похож на шахматы: на каждом этапе у нас очень мало разумных ходов. Но я всё ещё удивлён, что им это удаётся», — сказал профессор Нго Бао Чау.
Задача 3 конкурса IMO 2025, решённая AlphaGeometry. Фото: предоставлено персонажем.
AlphaGeometry сочетает в себе нейронную языковую модель с хорошими возможностями рассуждения и символьный движок, специализирующийся на логических рассуждениях, а затем настроенный для понимания геометрии.
Сначала нейронная сеть обучается на данных, алгоритмически сгенерированных на основе 100 миллионов примеров геометрических доказательств без использования решений человека. Когда AlphaGeometry начинает решать задачу, первым запускается символьный движок. Если он зависает, нейронная сеть предлагает другие способы решения.
Этот процесс называется «подпунктированием»: добавление линии, деление угла пополам, рисование подокружности... точно так же, как человек решает геометрическую задачу. Цикл продолжается до тех пор, пока не будет дан ответ или пока не истечёт 4,5 часа — время, отведённое на решение задач на экзамене IMO.
По словам трёх докторов наук, особенность этого ИИ заключается в том, что входные данные полностью искусственные. Триё отметил, что AlphaGeometry сама генерирует высококачественные данные, достаточно хорошие для достижения определённой производительности без необходимости использования обучающих данных, полученных с помощью человеческих решений. Другие инструменты ИИ, такие как ChatGPT или Gemini, не способны на это.
«Проще говоря, AlphaGeometry генерирует решения из ничего. Современные модели ИИ будут искать доступные или похожие человеческие решения», — поделился доктор Танг.
Команда также создала систему, состоящую из системы 1 (быстрой, автоматической, бессознательной реакции) и системы 2 (медленной, логической), объединенных вместе. Это вполне нормально, но в сочетании с искусственными данными это создаёт прорыв.
Три вьетнамских доктора наук в Google DeepMind (справа налево): Ле Вьет Куок, Чинь Хоанг Чиеу, Лыонг Минь Тханг. Фото: предоставлено персонажем
Идея создания AlphaGeometry возникла у Триеу в 2019 году, когда он искал тему для своей дипломной работы в Нью-Йоркском университете.
«Помню, ещё в старших классах мне нравилось решать геометрические задачи, но я не был достаточно хорош, чтобы сдать государственный экзамен. Поэтому я решил заняться этим, изначально просто пытаясь найти модель, которая могла бы решать простые математические задачи», — вспоминает уроженец Куинёна.
Изначально Куок и Тханг учились на факультете математики в старшей школе Куок Хок Хюэ и старшей школе для одарённых детей в Хошимине, но вскоре заинтересовались идеей Чиеу. Затем Чиеу присоединился к Google DeepMind и работает там с 2021 года.
К июлю 2022 года, после 10 версий, AlphaGeometry решила свою первую геометрическую задачу. Прорыв команды случился три месяца спустя, когда она решила геометрическую задачу на IMO.
По словам доктора Триеу, созданный группой ИИ может быть использован в качестве системы руководства, помогающей старшеклассникам изучать геометрию.
Эван Чен, аспирант кафедры математики Массачусетского технологического института и обладатель золотой медали IMO 2014 года, во время тестирования был удивлён тем, насколько хорошо справился ИИ. Чен отметил, что компьютерная программа обычно решает геометрические задачи, используя системы координат и алгебру, но AlphaGeometry использует чисто геометрические правила с подобными углами и треугольниками, как это делают студенты.
«Мне было любопытно, как AlphaGeometry удалось этого добиться», — сказал Чен.
Доктор Ле Ба Кхань Тринь (в центре) решает задачу номер 3 на IMO 2015. Фото: Венди Нгуен
Месяц назад, вернувшись в школу для одарённых детей, доктор Танг отправил доктору Ле Ба Кхань Чинь решение задачи № 3 на IMO 2015 с помощью ИИ. Это одна из самых сложных геометрических задач на IMO. AlphaGeometry выдала ответ после 109 шагов.
«Господин Чинь был впечатлён, поскольку решение задачи было выполнено по очень простым правилам, но он остался не очень доволен, поскольку, по его мнению, решения должны быть выразительными, иметь определённую красоту и быть связанными друг с другом», — вспоминает господин Тханг. Затем доктор Чинь применил метод инверсии, получив результат примерно через 20–30 шагов. Господин Чинь завоевал золотую медаль ММО 1979 года, набрав максимальное количество очков, а также стал единственным вьетнамцем, получившим специальный приз на конкурсе ММО за красивое и лаконичное решение геометрической задачи.
Команда утверждает, что это может стать способом дальнейшего совершенствования AlphaGeometry. Они также надеются, что дальнейшие шаги этого ИИ помогут людям решить 7 задач тысячелетия.
Доктор Ле Вьет Куок когда-то считал это «невозможной перспективой», поскольку ИИ может очень хорошо решать одношаговые задачи, но математические задачи часто состоят из сотен шагов.
«Гений искусственного интеллекта» из Google заявил, что гордится публикацией исследования вьетнамских инженеров в Nature — самом престижном международном журнале. По его словам, ИИ способен решать математические задачи и продвигать человечество вперёд.
«Потому что математика — это язык науки и технологий. Занятия математикой — это способ способствовать развитию этих областей», — сказал г-н Куок.
Доан Хунг
Комментарий (0)