DeepSeek, R2 모델 출시 연기. 사진: 블룸버그 |
중국 인공지능 스타트업 DeepSeek은 차세대 언어 모델인 R2를 아직 공식 출시하지 않았습니다. The Information 의 6월 26일 보도에 따르면, 주된 이유는 량원펑 CEO가 개발 중인 모델의 현재 성능에 만족하지 못하고 있기 때문입니다.
R2는 뛰어난 추론 및 프로그래밍 기능으로 전 세계적으로 큰 호응을 얻은 R1 모델을 대폭 업그레이드한 모델로 기대됩니다. 로이터 는 DeepSeek이 5월에 R2를 출시할 계획이라고 보도했습니다. AI 현지화 수요가 증가하는 가운데 다양한 언어 처리 능력을 향상시키는 것이 목표입니다.
지난 몇 달 동안 DeepSeek의 엔지니어링 팀은 R2 모델을 꾸준히 개선해 왔습니다. 하지만 출시 시기는 여전히 CEO 량(Liang)의 몫입니다. 관계자에 따르면, 그는 불필요한 위험을 피하기 위해 기술적 성능부터 상업적 타당성까지 제품의 모든 측면에 신중을 기하고 있다고 합니다.
DeepSeek은 내부적인 요인 외에도 외부적인 어려움에도 직면해 있습니다. 특히 AI 칩 공급 부족으로 하드웨어 성능 제한으로 인해 운영에 어려움을 겪고 있습니다. 기업 고객에게 모델을 배포하는 협력사인 중국 클라우드 컴퓨팅 기업들은 최근 미국의 기술 수출 제한으로 어려움을 겪고 있습니다.
The Information 에 따르면, 현재 대부분의 고객사는 엔비디아의 H20 칩 플랫폼에서 R1 모델을 사용하고 있습니다. 그러나 4월부터 해당 칩 제품군은 미국 정부의 수출 제한 목록에 올랐으며, 이는 엔비디아가 당시 중국에 합법적으로 수출할 수 있는 유일한 AI 칩 제품군이기도 합니다.
한편, DeepSeek은 R2 인프라 구축을 위해 여러 국내 주요 클라우드 서비스 제공업체와 접촉하고 기술 사양을 제출한 것으로 보입니다. 그러나 이 모델의 확장성은 경영진의 결정과 글로벌 AI 칩 시장 상황에 따라 좌우되기 때문에 아직 불확실합니다.
출처: https://znews.vn/deepseek-hoan-ra-mat-ai-moi-post1564148.html
댓글 (0)