DeepSeek, 국제 수학 경시대회 금메달 획득 가능한 AI 도구 출시

자연어, 해결책, 그리고 명확하고 일관된 주장을 통해 복잡한 문제를 해결하는 것은 수학을 잘하는 학생에게도 쉽지 않습니다. 하지만 DeepSeek은 이를 가능하게 하는 AI 모델 DeepSeekMath-V2를 개발했습니다.

DeepSeek ra mắt công cụ AI có khả năng giành HCV kỳ thi toán quốc tế - 1 — DeepSeek은 국제 시험 수준의 문제를 해결할 수 있는 AI 모델을 개발하여 깊은 인상을 남겼습니다(그림: AI).

평가 결과, DeepSeekMath-V2는 2025년 국제 수학 올림피아드(IMO)와 2024년 중국 수학 올림피아드(CMO)에서 문제 풀이 부문에서 금메달 수준의 점수를 획득했습니다.

AI 모델의 수학적 해석 및 추론 능력을 평가하는 IMO-ProofBench 테스트에 참여한 결과, DeepSeek의 DeepSeekMath-V2는 Google의 DeepMind, xAI의 Grok, OpenAI의 GPT-5 등 다른 AI 모델에 비해 뛰어난 점수를 받았습니다.

특히, DeepSeek의 AI 모델은 2024년 퍼트넘 수학 경시대회에서 120점 만점에 118점을 받았는데, 이 경시대회에서 최고 순위를 기록한 사람은 90점에 그쳤습니다. 퍼트넘 경시대회는 매년 12월에 열리는 대학생을 대상으로 하는 세계에서 가장 어렵고 권위 있는 수학 경시대회로 여겨집니다.

국제 대회의 많은 문제들은 정확한 숫자를 요구하는 경우가 아니라, 해결책을 도출하는 데 사용된 추론을 기반으로 점수가 결정되는 경우가 많습니다. 그러나 DeepSeekMath-V2는 인간처럼 자연어로 깊이 있는 추론 능력을 보여주어 이 AI 모델이 높은 점수를 받는 데 도움을 주었습니다.

DeepSeek은 AI 모델이 정확한 답변과 강력한 논증을 도출할 수 있도록 두 개의 대규모 언어 모델을 구축하여 서로 경쟁시켰다고 밝혔습니다. 한 모델은 수학적 논증과 증명을 생성하는 "증명자" 역할을 하고, 다른 모델은 제시된 논증을 검증하는 "판사" 역할을 합니다.

이런 방식의 작업은 빈약한 가설과 주장을 제거하고, 정답을 찾기 위한 해결책을 최적화하고 긴밀하게 주장하는 데 집중하는 데 도움이 됩니다.

DeepSeekMath-V2는 오픈 소스로 개발되어 커뮤니티가 소스 코드를 수정하여 다양한 목적으로 사용할 수 있습니다.

DeepSeek은 DeepSeekMath-V2로 달성한 획기적인 성과가 더욱 강력하고 안정적인 수학적 AI 시스템을 구축하는 기반을 마련할 것이라고 밝혔습니다.

DeepSeek은 1월 말 AI R1 모델을 출시해 빠르고 정확한 응답 속도를 제공하며 전 세계적으로 주목을 받고 있는 중국 기술 기업입니다.

R1의 하이라이트는 DeepSeek이 미국의 기술 회사처럼 자체 AI 모델을 훈련하고 운영하는 데 수십억 달러를 지출해야 하는 것과 달리, 이 AI 모델을 개발하고 훈련하는 데 약 650만 달러만 썼다는 점입니다.

또한, R1은 미국 정부 의 금수 조치로 인해 중국 기업들이 고사양 AI 칩을 주문할 수 없기 때문에 DeepSeek에서 구세대 AI 칩을 기반으로 개발 및 운영했습니다. 그럼에도 불구하고 R1은 여전히 뛰어난 처리 능력과 사용자 요청에 대한 응답 속도를 보여줍니다.

DeepSeek의 등장으로 미국은 AI 모델 개발 경쟁에서 독점적 지위를 잃었고, 동시에 새로운 경쟁이 시작되었습니다. 기술 기업들은 지능과 처리 능력에만 집중하는 대신, AI 모델 개발 과정에서 경제적 효율성 문제에 더 많은 관심을 기울이기 시작했습니다.

출처: https://dantri.com.vn/cong-nghe/deepseek-ra-mat-cong-cu-ai-co-kha-nang-gianh-hcv-ky-thi-toan-quoc-te-20251130154751624.htm