주요 신뢰도 평가 기관의 테스트에서 중국의 AI DeepSeek은 정확도가 17%에 그쳐, 평가 대상인 AI 챗봇 11개 중 10위를 차지했습니다.
중국의 AI 챗봇 DeepSeek, 세계 기술 시장에 '파동' 일으키다 - 사진: 로이터
로이터에 따르면, 1월 29일(현지 시간) 신뢰도 평가 기관 뉴스가드는 중국의 AI 챗봇 딥시크가 현재 뉴스 상황과 관련된 질문에 답변할 때 정확도가 17%에 그쳤다는 보고서를 발표했습니다.
이 수치는 서구 챗봇의 평균보다 훨씬 낮으며, 테스트된 11개 AI 애플리케이션 중 10위를 차지했습니다.
구체적으로, DeepSeek은 30%의 경우 거짓 정보를 반복했고, 53%의 경우 모호하거나 도움이 되지 않는 답변을 제공했습니다. 즉, DeepSeek이 제공하는 뉴스 정보의 실패율은 최대 83%에 달합니다.
DeepSeek의 직접적인 경쟁자인 ChatGPT, Gemini 등을 포함한 서양 챗봇의 평균 오류율은 약 62%입니다.
NewsGuard는 DeepSeek과 서양 챗봇에게 동일한 질문 300개를 사용했으며, 이 중 30개는 온라인에서 유포되고 있는 10가지 잘못된 정보를 기반으로 한 것이라고 밝혔습니다.
유나이티드헬스케어 CEO 브라이언 톰슨의 암살과 카자흐스탄에서 발생한 아제르바이잔 항공기 추락 사고와 관련된 허위 정보입니다.
특히, 위 질문 중 10개 중 3개에서 DeepSeek은 질문이 중국과 관련이 없고 해당 사령부가 인구 10억 명의 국가를 언급하지 않았음에도 불구하고 임의로 중국 정부 의 관점을 삽입했습니다.
로이터는 이 결과를 보고 많은 전문가가 DeepSeek의 AI 기술이 OpenAI와 "동등하거나 더 뛰어나다"는 주장에 회의적인 태도를 보였다고 전했습니다.
한편, NewsGuard는 DeepSeek와 다른 AI 챗봇이 쉽게 악용되어 거짓 콘텐츠를 퍼뜨리도록 "훈련"될 수 있다고 지적했습니다.
DeepSeek의 챗봇은 1월 10일에 출시되었고 곧바로 Apple 앱 스토어에서 가장 많이 다운로드된 앱이 되었습니다.
이로 인해 미국이 AI 분야에서 주도적 우위를 잃을 수 있다는 우려가 빠르게 커졌습니다. DeepSeek의 상승세에 따라 많은 투자자가 미국 기술주를 매도했고, 이로 인해 해당 산업의 시가총액이 폭락했습니다.
DeepSeek은 아직 NewsGuard의 최신 보도에 응답하지 않았습니다.
[광고_2]
출처: https://tuoitre.vn/deepseek-chi-dat-17-do-chinh-xac-thua-xa-doi-thu-phuong-tay-20250130115359435.htm
댓글 (0)