OpenAI, 새로운 AI 모델로 '전례 없는' 성과 발표

OpenAI의 최신 인공지능(AI) 모델이 세계에서 가장 어려운 수학 대회 중 하나인 국제수학올림피아드(IMO)에서 금메달에 해당하는 성적을 달성했습니다.

OpenAI 기술팀의 일원인 알렉산더 웨이는 X 플랫폼에 다음과 같은 정보를 공유했습니다. "저희의 최신 실험적 추론 모델은 IMO에서 금메달과 동등한 성능 수준을 달성했습니다."

openai ai 모델 imo.jpg — OpenAI는 AI 추론 모델로 새로운 성과를 발표했습니다. 사진: X

IMO는 1959년 루마니아에서 시작된 국제 수학 경시대회로, 4시간 30분씩 이틀에 걸쳐 3개의 주관식 문제를 푸는 방식으로 진행됩니다. IMO 역대 참가자로는 그리고리 페렐만과 필즈상 수상자 테렌스 타오가 있습니다.

6월 인터뷰에서 테렌스 타오는 AI가 IMO에서 높은 점수를 받을 가능성은 낮으며, 더 간단한 경쟁에 집중해야 한다고 말했습니다.

하지만 웨이에 따르면 OpenAI의 새로운 모델은 인간 수준의 테스트 조건에서 6가지 문제 중 5가지를 올바르게 해결했습니다.

팀의 또 다른 멤버인 노엄 브라운은 이 모델이 장기간 사고를 지속할 수 있는 능력을 보여주었다고 말했습니다. 이는 IMO 문제에 필수적인 요소입니다. 그는 "이러한 문제들은 지속적인 창의적 사고를 필요로 하는데, 이는 이전 측정 방식과는 다릅니다." 라고 말했습니다.

웨이는 이를 일반 지능의 한 단계 진전으로 보고 있습니다. DeepMind의 AlphaGeometry가 수학을 위해 특별히 설계된 반면, OpenAI의 모델은 보다 일반적인 맥락에서 수학을 처리할 수 있는 대규모 언어 시스템(LLM)입니다.

OpenAI CEO 샘 알트만은 이것이 중요한 성과라고 말했지만, 이 수준의 모델은 몇 달 후에야 대중에 공개될 것이라고 덧붙였습니다. 그는 X에 "OpenAI를 설립했을 때 이렇게 빨리 이루어질 줄은 몰랐습니다."라고 글을 남겼습니다.

이러한 성과는 기술 발전의 속도를 반영합니다. 브라운은 작년만 해도 AI 연구실들이 초등학교 수학을 활용하여 모델을 평가했다고 지적합니다.

기술 기업가 피터 티엘은 AI가 미국 수학 올림피아드 시험을 풀려면 최소 3년은 걸릴 것이라고 말했습니다.

하지만 일부는 여전히 신중한 입장을 보입니다. 가장 저명한 AI 비평가 중 한 명인 게리 마커스는 결과를 "인상적"이라고 평했지만, 훈련 방식, 일반 지능의 범위, 실제 적용, 그리고 문제당 비용에 대해서도 의문을 제기했습니다. 그는 또한 IMO가 결과를 독립적으로 검증하지 않았다고 지적했습니다.

(인사이더에 따르면)