미국 연구진이 개발한 AI(인공지능) 모델 s1은 운영 비용이 50달러에 불과하지만 훨씬 더 비싼 OpenAI의 o1 모델과 동등한 추론 성능을 제공한다고 합니다. s1의 등장은 최근 실리콘 밸리에서 화제를 모았던 DeepSeek의 눈부신 성공에 힘입은 것입니다.
DeepSeek 등장 이후 '저렴한 AI' 전쟁이 치열해지고 있다
연구팀은 s1 소스 코드와 모델 구축에 사용된 코드 및 데이터를 GitHub에 공개했습니다. 지난주에 발표된 논문에서는 모델 개발 과정을 설명하고, 개발팀이 사용한 기발한 기법들을 강조했습니다. 연구팀은 새로운 추론 모델을 처음부터 개발하는 대신, 기존 언어 모델을 활용하고 구글 제미니 2.0 플래시 씽킹 실험 모델의 추론 기능을 정제하는 "미세 조정" 과정을 거쳤습니다.
AI 운영 비용은 '50달러 미만'
s1 모델을 학습하는 데는 Nvidia H100 GPU 16개를 사용하여 단 30분밖에 걸리지 않았습니다. GPU당 가격은 약 25,000달러이지만, 클라우드 컴퓨팅 서비스 덕분에 프로세스 임대 비용은 50달러 미만이었습니다. 특히, 연구팀은 모델이 최종 답을 제시하기 전에 "대기"하도록 지시하는 유용한 방법을 발견했는데, 이를 통해 모델의 추론 능력이 향상되고 더 나은 해답을 도출할 수 있었습니다.
s1은 저렴한 비용으로 상당한 성과를 거두었지만, 확장성에 대한 우려가 있습니다. 구글의 모델을 "교사"로 사용하는 것은 오늘날의 선도적인 AI 모델들과 경쟁할 수 있을지에 대한 의문을 제기합니다. 특히 OpenAI와 DeepSeek 간의 소송이 진행 중인 점을 고려할 때, 구글은 이 상황을 예의주시할 것으로 예상됩니다.
[광고_2]
출처: https://thanhnien.vn/my-tao-ra-mo-hinh-ai-sieu-re-hoat-dong-tuong-tu-gpt-o1-185250207182535164.htm
댓글 (0)