DeepSeek은 보고서에서 총 훈련 비용이 557만 6천 달러라고 밝혔는데, 이는 주로 엔비디아의 그래픽 처리 장치 임대 비용 때문이었습니다. DeepSeek은 또한 이 수치는 "공식 훈련"만을 반영하며, 아키텍처, 알고리즘, 데이터에 대한 기존 연구나 실험 관련 비용은 포함하지 않는다고 경고했습니다. 이는 투자자들의 관심을 즉시 끌었고, 1월 27일 단 하루 만에 전 세계 기술주들의 가치가 1조 달러나 증발하는 결과를 초래했습니다.
DeepSeek의 운영 비용이 주장하는 것보다 훨씬 더 높습니까?
반도체 연구 및 컨설팅 회사인 SemiAnalysis의 보고서는 DeepSeek의 개발 비용에 대해 다른 견해를 제시합니다. SemiAnalysis는 DeepSeek의 하드웨어 지출이 주장보다 훨씬 높을 것으로 추정하며, 연구 개발(R&D)과 총소유비용(TCO)이 상당했다고 지적합니다.
SemiAnalysis는 모델 학습을 위한 "합성 데이터"를 생성하려면 "상당한 컴퓨팅 성능"이 필요할 것이라고 밝혔습니다. 또한, 기업들은 실험, 새로운 아키텍처 개발, 데이터 수집 및 정리, 그리고 직원들의 임금 지급 등을 수행해야 할 것입니다.
DeepSeek에 2,000개가 아닌 50,000개의 GPU가 필요한가?
계산에 따르면, 전문가들은 DeepSeek이 약 5만 개의 Hopper GPU, 1만 개의 H800 GPU, 그리고 1만 개의 더 강력한 H100 GPU, 그리고 추가 H20 GPU로 구성된 대규모 컴퓨팅 시스템을 운영한다고 밝혔습니다. 이는 DeepSeek이 이전에 주장했던 2,048개의 Nvidia GPU만 사용한다는 주장과 모순됩니다. 서버의 총 자본 지출은 약 16억 달러로 추산되며, 운영 비용은 최대 9억 4,400만 달러에 달합니다.
SemiAnalysis는 DeepSeek에서 50,000개의 Nvidia GPU가 사용되었다고 추정합니다.
DeepSeek은 중국 AI 전문 헤지펀드인 High-Flyer의 공동 창업자인 량원펑(Liang Wenfeng)이 2023년에 설립했습니다. 이 스타트업은 2023년 4월, 펀드의 AI 연구 부서에서 성장하여 대규모 언어 모델 개발 및 인공 범용 지능(AGI) 구현을 목표로 합니다.
DeepSeek에 대한 관심은 회사가 OpenAI의 o1과 경쟁하는 추론 모델인 R1을 출시하면서 더욱 커졌습니다. 하지만 오픈소스이기 때문에 모든 AI 개발자가 사용할 수 있습니다. 하지만 다른 많은 중국 챗봇과 마찬가지로 DeepSeek 역시 특정 주제에 대한 제약이 있습니다.
OpenAI CEO 샘 알트만은 DeepSeek의 모델을 칭찬하며 "분명히 훌륭한 모델"이라고 말했습니다. 하지만 그는 DeepSeek이 OpenAI의 데이터를 "정제된" 방식으로 수집했다는 증거가 있다고 덧붙였습니다.
[광고_2]
출처: https://thanhnien.vn/chi-phi-phat-trien-deepseek-bi-tang-boc-185250203151508438.htm
댓글 (0)