최근 독일의 한 연구진이 인공지능 챗봇을 이용해 연구 논문의 내용을 요약하는 과정에서 편향이 발생할 가능성에 대해 경고했습니다. 연구팀은 사람이 직접 작성한 4,900건의 과학 논문 초록을 분석한 후, 다양한 인공지능 모델을 사용하여 정보 처리 방식을 비교했습니다. 그 결과, 대부분의 챗봇이 정확한 요약을 요구받았음에도 불구하고 내용을 지나치게 일반화하는 오류를 범하는 것으로 나타났습니다.
ChatGPT와 DeepSeek은 과학 데이터를 왜곡합니다.
ChatGPT와 DeepSeek 같은 AI 모델은 특히 의학 분야에서 과학적 내용을 요약할 때 내용을 왜곡할 수 있는 것으로 밝혀졌습니다.
인공지능은 과학 연구 결과를 요약할 때 내용을 쉽게 왜곡할 수 있습니다.
실험 결과, AI 모델은 별도의 지침 없이 진행했을 때 인간 연구원보다 5배나 많은 오류를 범했습니다. 정확도에 대한 명확한 요구 사항이 주어졌음에도 불구하고 오류율은 표준 요약 방식보다 두 배나 높았습니다. 한 연구원는 "일반화는 때로는 무해해 보일 수 있지만, 실제로는 원래 연구의 본질을 바꿔놓습니다. 이는 체계적인 편향입니다."라고 말했습니다.
특히, 최신 버전의 챗봇은 문제를 해결하지 못할 뿐만 아니라 오히려 악화시키는 경향이 있습니다. AI가 생성한 요약 정보는 매끄럽고 매력적인 전달 방식을 통해 신뢰감을 주지만, 실제 내용은 왜곡되어 있습니다. 예를 들어, DeepSeek은 "안전하고 성공적으로 구현 가능"이라는 문구를 "안전하고 효과적인 치료법"으로 바꾸어 연구의 원래 결론과 다른 해석을 제시했습니다.
또 다른 예로, 라마 모델은 복용량, 복용 빈도, 부작용 등을 명시하지 않고 젊은 피험자들에게 당뇨병 약물 복용 권장 사항을 적용했습니다. 의사나 의료 전문가가 원 연구와 대조하여 확인하지 않으면 이러한 요약 정보는 환자에게 직접적인 위험을 초래할 수 있습니다.
전문가들은 이러한 현상이 AI 모델 학습 방식에서 비롯된다고 보고 있습니다. 현재 많은 챗봇은 대량 생산되는 과학 뉴스처럼 이미 단순화된 2차 데이터를 사용하여 학습됩니다. AI가 이러한 단순화된 콘텐츠를 계속해서 요약할수록 왜곡될 위험이 커집니다.
정신 건강 분야의 AI 전문가들은 AI 개발 및 활용에 대한 기술적 장벽을 조속히 마련해야 한다고 주장합니다.
챗봇은 콘텐츠를 쉽게 왜곡할 수 있으므로 사용자는 주의해야 합니다.
사용자들이 과학 정보를 학습하기 위해 인공지능 챗봇에 점점 더 의존함에 따라, 해석상의 작은 오류들이 빠르게 누적되어 확산되고, 결국 광범위한 오해를 불러일으킬 수 있습니다. 과학에 대한 신뢰가 하락하는 현 시점에서 이러한 위험은 특히 우려스럽고, 마땅한 주의를 기울여야 합니다.
인공지능을 연구 및 지식 보급에 통합하는 것은 되돌릴 수 없는 추세입니다. 그러나 전문가들은 기술이 과학적 콘텐츠를 이해하고 검증하는 데 있어 인간의 역할을 대체할 수는 없다고 주장합니다. 의료와 같은 고위험 분야에서 챗봇을 사용할 때는 단순히 매끄러운 언어 경험이나 빠른 응답 속도에만 집중하기보다는 정확성을 최우선으로 고려해야 합니다.
출처: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html











