
구글은 7월 23일 자사의 인공지능(AI) 모델이 2025년 국제수학올림피아드(IMO)에서 금메달을 수상했다고 발표하며 세상을 놀라게 했습니다.
WSJ 에 따르면, 루옹 민 탕 박사와 그의 동료들이 이 업적의 "설계자"라고 합니다. 작년에 이 모델은 은메달에 그쳤습니다. 금메달을 목표로 구글은 다목적 모델인 제미니 딥싱크(5월 개발자 컨퍼런스에서 소개된 버전)를 사용하기로 결정했습니다.
하지만 민 탕 박사는 처음에는 동메달이나 은메달을 또 받을 것으로 예상했습니다. 대회가 시작되기 전부터 탕 박사 팀은 계속해서 수정 작업을 하고 있었습니다. 처음에 탕 박사는 딥마인드 모델이 첫날에 세 가지 문제를 모두 해결할 수 있을 것으로만 예상했습니다.
AI, 국제올림픽 금메달 '정복'
그 해법의 단순함, 우아함, 그리고 가독성은 수학자들을 놀라게 했습니다. 다음 날, 탕 박사와 그의 동료들은 AI 시스템이 두 가지 문제를 더 해결했다는 사실을 알게 되었고, 금메달을 딸 수 있다는 것을 깨달았습니다.
그 결과, 딥마인드 AI는 6개 문제 중 5개를 성공적으로 해결했습니다. 특히, 모든 문제가 경험적 추론 모델을 사용하여 자연어로 수학적 개념을 처리했는데, 이는 과거 AI 기업들이 사용해 온 복잡한 접근 방식과는 상당히 다릅니다.
민 탕 박사는 WSJ 에 "이것은 아마도 차세대 수학자들을 이끌어갈 새로운 컴퓨터가 될 수 있을 것"이라고 말했습니다.
![]() |
AlphaGeometry 팀원(왼쪽부터)은 Yuhuai Wu, Trinh Hoang Trieu, Le Viet Quoc, Luong Minh Thang입니다. 사진: Aaron Cohen |
로이터 에 따르면, 이번 성과는 1년도 채 걸리지 않아 수학자들이 AI를 활용해 아직 해결되지 않은 연구 문제를 해결할 수 있음을 보여줍니다.
브라운대(미국) 수학과 정준혁 교수이자 AI 딥마인드 연구원은 "자연어로 어려운 추론 문제를 풀 수 있는 순간 AI와 수학자의 협력 가능성이 열릴 것으로 생각한다"고 말했다.
구글의 연구원들도 이러한 낙관론에 공감하며, AI 모델의 역량이 물리학 등 다른 분야의 연구 과제에 적용될 수 있다고 믿습니다.
20년 전, 탕 씨는 팀에서 전국 8위를 차지해 IMO 시험에 떨어졌고, 국제 대회에 출전할 후보자는 단 6명뿐이었습니다.
수학의 정점을 정복하겠다는 그의 꿈은 이루어지지 않았지만, 대학에 진학하면서 인공지능(AI)에 눈을 돌렸습니다. 이 전환점을 계기로 그는 특별한 방식으로 IMO 2024 시험에 참가하게 되었습니다. 일반 참가자가 아닌, AlphaGeometry 팀이 개발한 AI 소프트웨어 AlphaGeometry를 통해 영국 배스에서 100여 개국의 수학적 재능을 가진 사람들과 경쟁하게 된 것입니다.
Thang 박사는 "2024년 7월, 우리 팀은 AI를 처음으로 국제수학올림피아드(IMO)에 참가시켜 은메달을 획득했습니다."라고 말했습니다.
도약하다
구글 딥마인드 팀은 작년 IMO 대회에 알파프루프(AlphaProof)와 알파지오메트리2(AlphaGeometry 2) 모델을 포함한 AI를 사용하여 참가했습니다. 첫 번째 시도에서 구글의 AI는 6개 문제 중 4개를 정확하게 답하여 은메달을 획득했습니다.
2025년까지 Google DeepMind는 IMO와 협력하여 공식적으로 AI 모델을 대회에 출품한 회사 중 하나이며, 코디네이터가 점수를 매기고 인증합니다.
![]() |
금메달을 따기 위해 구글은 다목적 모델인 제미니 딥싱크(Gemini Deep Think)를 사용하기로 결정했습니다(5월 개발자 컨퍼런스에서 소개된 버전). 사진: 구글. |
이 획기적인 발견을 기념하기 위해 검색 대기업은 완전히 새로운 모델을 준비했습니다. Deep Think는 선형적인 "사고" 경로를 따르는 대신, 여러 추론 과정을 병렬로 실행하여 결과를 통합하고 비교하여 최종 답을 도출합니다.
탕 박사에 따르면 이는 중대한 패러다임 전환입니다. 2024년에는 전문가가 자연어 질문을 "도메인별 언어"로 번역해야 할 것입니다. 그리고 그 결과를 설명해야 할 것입니다.
하지만 Deep Think를 사용하면 AI 시스템은 처음부터 끝까지 자연어로만 작동할 수 있으며, 단순히 수학 문제를 푸는 것 이상의 많은 작업을 수행할 수 있습니다.
이전에는 수학 LLM을 향상시키려면 최종 답을 도출하는 강화 학습이 필요했습니다. 민 탕 박사는 Ars Technica 와의 인터뷰에서 이러한 방식으로 학습된 모델은 정답을 얻을 수 있지만, "불완전한 추론"을 가지고 있으며, IMO 채점의 일부는 해의 표현을 기반으로 한다고 설명했습니다.
따라서 Google은 Deep Think를 IMO에 맞춰 준비하기 위해 새로운 강화 학습 기법을 사용하여 수학 문제에 대한 더 높은 품질의 "긴 답변" 솔루션을 제공함으로써 모델이 답을 찾는 과정의 모든 단계를 처리하는 데 더 나은 기반을 제공했습니다.
"이런 유형의 훈련을 받으면 정말 강력하고 장기적인 추론 능력을 키울 수 있습니다."라고 Thang 박사는 말합니다.
![]() |
루옹 민 탕 박사가 레 바 칸 찐 씨와 해결된 IMO 알파지오메트리 문제에 대해 논의하고 있습니다. 사진: 웬디 응우옌. |
지난 몇 년 동안 Google DeepMind와 같은 AI 회사는 IMO의 독특한 과제로 인해 특히 관심을 표명했습니다.
이 대회는 고등학생을 대상으로 하지만, 여전히 비판적 사고력과 대수학, 조합론, 기하학, 수론을 포함한 수학의 여러 분야에 대한 이해가 필요합니다.
가장 진보된 AI 모델만이 이러한 다층적인 문제에 정확하게 답할 수 있습니다. DeepMind 팀은 Deep Think의 성능에서 몇 가지 흥미로운 측면을 지적했는데, 이는 고급 학습에서 비롯되었다고 합니다.
예를 들어, 세 번째 문제에서 많은 참가자는 디리클레 정리라는 대학원 수준의 개념을 적용했는데, 이는 대회의 의도된 범위를 벗어나는 수학을 사용했습니다.
하지만 딥씽크는 더 간단한 수학으로도 문제를 해결할 수 있다는 것을 깨달았습니다. 정 교수는 "저희 모델은 실제로 훌륭한 관찰을 했고, 기본적인 정수론만을 사용하여 문제에 대한 독립적인 증명을 도출했습니다."라고 말했습니다.
출처: https://znews.vn/tien-si-nguoi-viet-dung-sau-ky-tich-cua-ai-tai-olympic-toan-quoc-te-post1572494.html
댓글 (0)