BGR 에 따르면, 캘리포니아 대학교 버클리(미국)의 연구진은 인기 있는 AI 모델인 DeepSeek의 핵심 기술을 단 30달러의 비용으로 성공적으로 재현했다고 발표하면서 기술계를 깜짝 놀라게 했습니다.
DeepSeek의 핵심 기술, 'Piece of Gold'로 재현
이 정보는 연구팀을 이끈 박사과정생 판 지아이(Jiayi Pan)가 Nitter 플랫폼에 게시했습니다. 연구팀은 DeepSeek R1-Zero의 강화 학습 기능을 재현하기 위해 30억 개의 매개변수만 있는 소규모 언어 모델을 사용했습니다. 특히, 이 모델은 DeepSeek의 응답을 개선하는 데 중요한 기능인 자체 검증 및 검색 기능을 여전히 갖추고 있었습니다.
DeepSeek의 핵심 기술을 단 30달러로 재현
사진: CNBC 스크린샷
이를 테스트하기 위해 연구팀은 모델에게 산수 퍼즐의 일종인 카운트다운이라는 게임을 하게 했습니다. 처음에는 모델이 무작위로 답을 생성했지만, 강화 학습을 통해 스스로를 조정하여 정답을 도출했습니다. 복소수 곱셈 문제에 직면했을 때, 모델은 사람과 유사한 방식으로 문제를 분석하고 해결하기까지 했습니다.
기술계를 놀라게 한 것은 DeepSeek을 재현하는 데 드는 비용이 30달러에 불과하다는 점이었습니다. 이 금액은 OpenAI, 구글, 마이크로소프트와 같은 '거대 기업'들이 AI 개발에 투자하는 수십억 달러에 비하면 턱없이 적은 금액입니다. 이 연구는 강력한 AI 모델을 개발하는 데 반드시 막대한 예산이 필요한 것은 아니라는 점을 보여줍니다.
그러나 DeepSeek의 주장, 특히 모델 학습 비용에 대한 진실성에 대해서는 회의적인 시각도 있습니다. AI 연구원 네이선 램버트는 DeepSeek의 500만 달러라는 수치가 실제로 비용을 반영하는지 의문을 제기하며, DeepSeek이 중국으로 데이터를 이전하는 것에 대한 우려를 표명했습니다.
이러한 논란에도 불구하고, 버클리 팀의 연구는 막대한 투자 없이도 고급 강화 학습을 구현할 수 있음을 보여줍니다. 이는 AI에 혁명을 일으켜 소규모 기업과 독립 연구자들이 기술 경쟁에 참여할 수 있도록 할 것입니다.
[광고_2]
출처: https://thanhnien.vn/tai-tao-duoc-cong-nghe-cot-loi-cua-deepseek-chi-voi-30-usd-185250130220537439.htm
댓글 (0)