Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek은 호기심을 자극합니다.

중국 AI 기업들은 차세대 모델링에 대한 기대가 높아지는 가운데 새로운 AI 추론 방법을 개발했습니다.

ZNewsZNews07/04/2025

딥시크는 언론에 자주 등장하기보다는 새로운 모델 연구 개발에 집중하고 있다. 사진: SCMP

딥시크는 칭화대학교 연구진과의 협력을 통해 대규모 언어 모델(LLM)의 추론 능력을 향상시키는 새로운 방법을 개발했습니다. 4월 4일 저녁에 발표된 연구 논문에 따르면, 이 방법은 LLM이 일반적인 쿼리에 대해 더 나은 결과를 더 빠르게 도출하도록 도와줍니다.

이 기술은 DeepSeek에서 이전에 성공을 거둔 두 가지 방법을 결합한 것입니다. 하나는 AI 모델이 이전 결과를 기반으로 응답을 자체 평가하고 개선할 수 있도록 하는 생성적 보상 모델링(GRM)이고, 다른 하나는 자기 원칙 기반 비판 튜닝입니다.

두 방법 모두 인공지능의 "자체 학습" 측면에 의존하여 인간의 직접적인 피드백이나 지침에 대한 의존도를 줄이지만, 인간의 기대에 더 가까운 결과를 도출하는 것을 목표로 합니다.

연구원들에 따르면, DeepSeek-GRM은 새로운 방법임에도 불구하고 뛰어난 결과를 보여주며 현재 가장 잘 알려지고 효과적인 AI 모델들과 경쟁할 수 있다고 합니다. DeepSeek은 GRM 모델을 오픈소스로 공개할 계획이지만, 구체적인 시기는 아직 밝히지 않았습니다.

딥시크는 V3 플랫폼 모델과 R1 추론 모델로 전 세계적인 주목을 받은 후, 온라인 과학 아카이브인 arXiv에 이 논문을 발표하여 회사의 차기 행보에 대한 궁금증을 불러일으켰습니다.

로이터 통신은 전작인 딥시크 R1의 지속적인 인기를 고려할 때, 후속 제품인 딥시크 R2가 4월에 출시될 수 있다고 예측했습니다. 딥시크 R1은 뛰어난 가격 대비 성능으로 전 세계 기술 업계에 센세이션을 일으켰으며, 현재 업계를 선도하는 모델들과 경쟁할 만한 성능을 보여주었습니다.

딥시크는 해당 루머에 대해 침묵을 유지하고 있습니다. 그러나 현지 소식통에 따르면, 딥시크 고객 서비스 계정의 한 담당자가 기업 고객들과의 그룹 채팅에서 해당 정보를 부인했다고 합니다.

2023년 항저우에서 기업가 량원펑이 설립한 딥시크는 지난 몇 달 동안 빠르게 전 세계적인 주목을 받았습니다. 하지만 이 회사는 대중적인 인기를 활용하기보다는 연구 개발에 자원을 집중하고 있습니다.

앞서 딥시크는 V3 모델을 업그레이드하여 DeepSeek-V3-0324 버전을 출시했습니다. 발표에 따르면 이번 업데이트는 추론 기능 향상, 웹 사용자 인터페이스 개발 최적화, 중국어 쓰기 기능 개선 등의 특징을 갖추고 있습니다.

2월에 이 스타트업은 5개의 코드 저장소를 오픈소스로 공개하며 "완전한 투명성을 바탕으로 발전해 나가겠다"는 의지를 재확인했습니다. 또한 같은 달에 대규모 데이터 처리 시 LLM(로컬 라이프사이클)의 성능 향상에 도움이 되는 "네이티브 스파스 어텐션"에 대한 기술 연구를 발표했습니다.

딥시크는 미국이 중국의 기술 발전을 억제하려 하는 시점에서 중국 인공지능 산업의 역동성을 상징하는 존재로 여겨진다.

출처: https://znews.vn/deepseek-gay-to-mo-post1543900.html


댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
선을 넘었다.

선을 넘었다.

항구에서의 행복

항구에서의 행복

주위를 둘러보고, 같은 방향을 보고, 먼 곳을 바라보세요.

주위를 둘러보고, 같은 방향을 보고, 먼 곳을 바라보세요.