Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek은 호기심을 자극합니다.

중국 AI 기업들은 차세대 모델링에 대한 기대가 높아지는 가운데 새로운 AI 추론 방법을 개발했습니다.

ZNewsZNews07/04/2025

딥시크는 언론에 자주 등장하기보다는 새로운 모델 연구 개발에 집중하고 있다. 사진: SCMP

딥시크는 칭화대학교 연구진과의 협력을 통해 대규모 언어 모델(LLM)의 추론 능력을 향상시키는 새로운 방법을 개발했습니다. 4월 4일 저녁에 발표된 연구 논문에 따르면, 이 방법은 LLM이 일반적인 쿼리에 대해 더 나은 결과를 더 빠르게 도출하도록 도와줍니다.

이 기술은 DeepSeek에서 이전에 성공을 거둔 두 가지 방법을 결합한 것입니다. 하나는 AI 모델이 이전 결과를 기반으로 응답을 자체 평가하고 개선할 수 있도록 하는 생성적 보상 모델링(GRM)이고, 다른 하나는 자기 원칙 기반 비판 튜닝입니다.

두 방법 모두 인공지능의 "자체 학습" 측면에 의존하여 인간의 직접적인 피드백이나 지침에 대한 의존도를 줄이지만, 인간의 기대에 더 가까운 결과를 도출하는 것을 목표로 합니다.

연구원들에 따르면, DeepSeek-GRM은 새로운 방법임에도 불구하고 뛰어난 결과를 보여주며 현재 가장 잘 알려지고 효과적인 AI 모델들과 경쟁할 수 있다고 합니다. DeepSeek은 GRM 모델을 오픈소스로 공개할 계획이지만, 구체적인 시기는 아직 밝히지 않았습니다.

딥시크는 V3 플랫폼 모델과 R1 추론 모델로 전 세계적인 주목을 받은 후, 온라인 과학 아카이브인 arXiv에 이 논문을 발표하여 회사의 차기 행보에 대한 궁금증을 불러일으켰습니다.

로이터 통신은 전작인 딥시크 R1의 지속적인 인기를 고려할 때, 후속 제품인 딥시크 R2가 4월에 출시될 수 있다고 예측했습니다. 딥시크 R1은 뛰어난 가격 대비 성능으로 전 세계 기술 업계에 센세이션을 일으켰으며, 현재 업계를 선도하는 모델들과 경쟁할 만한 성능을 보여주었습니다.

딥시크는 해당 루머에 대해 침묵을 유지하고 있습니다. 그러나 현지 소식통에 따르면, 딥시크 고객 서비스 계정의 한 담당자가 기업 고객들과의 그룹 채팅에서 해당 정보를 부인했다고 합니다.

2023년 항저우에서 기업가 량원펑이 설립한 딥시크는 지난 몇 달 동안 빠르게 전 세계적인 주목을 받았습니다. 하지만 이 회사는 대중적인 인기를 활용하기보다는 연구 개발에 자원을 집중하고 있습니다.

앞서 딥시크는 V3 모델을 업그레이드하여 DeepSeek-V3-0324 버전을 출시했습니다. 발표에 따르면 이번 업데이트는 추론 기능 향상, 웹 사용자 인터페이스 개발 최적화, 중국어 쓰기 기능 개선 등의 특징을 갖추고 있습니다.

2월에 이 스타트업은 5개의 코드 저장소를 오픈소스로 공개하며 "완전한 투명성을 바탕으로 발전해 나가겠다"는 의지를 재확인했습니다. 또한 같은 달에 대규모 데이터 처리 시 LLM(로컬 라이프사이클)의 성능 향상에 도움이 되는 "네이티브 스파스 어텐션"에 대한 기술 연구를 발표했습니다.

딥시크는 미국이 중국의 기술 발전을 억제하려 하는 시점에서 중국 인공지능 산업의 역동성을 상징하는 존재로 여겨진다.

출처: https://znews.vn/deepseek-gay-to-mo-post1543900.html


댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
자연 속에서 홀로

자연 속에서 홀로

경쟁

경쟁

5 테

5 테