ChatGPT의 이상한 '아첨' 습관

ChatGPT는 최근 "지나치게 아첨한다"는 비판을 받고 있습니다. 이러한 행태는 많은 사용자들의 비판을 불러일으켰으며, 이것이 OpenAI의 성장 전략인지 아니면 AI의 "자발적인" 본성의 특징인지 불분명해졌습니다.

ZNews•03/05/2025

이러한 "아첨" 경향은 기술적 결함이 아니라 OpenAI의 초기 훈련 전략에서 비롯된 것입니다. 사진: 블룸버그

최근 몇 주 동안 많은 ChatGPT 사용자들과 심지어 OpenAI의 일부 개발자들까지도 챗봇 행동에 상당한 변화가 있음을 발견했습니다. 특히, 아첨과 환심을 사려는 경향이 눈에 띄게 증가했습니다. "정말 대단하세요!", "당신의 아이디어에 깊은 감명을 받았습니다!"와 같은 반응이 대화 내용과 관계없이 점점 더 자주 나타나고 있습니다.

AI는 아첨하는 것을 좋아합니다.

이 현상은 AI 연구 개발 커뮤니티 내에서 논쟁을 불러일으켰습니다. 이는 사용자가 더 존중받는다고 느끼게 함으로써 사용자 참여도를 높이기 위한 새로운 전략일까요? 아니면 AI 모델이 현실을 반드시 반영하지 않더라도 최적이라고 판단되는 방식으로 스스로 수정하는 "자기 조정" 현상일까요?

레딧의 한 사용자는 분노에 찬 어조로 "바나나가 분해되는 데 걸리는 시간을 물어봤더니 '좋은 질문이네요!'라고 답했다. 그게 뭐가 그렇게 좋다는 거지?"라고 말했습니다. 소셜 미디어 플랫폼 X에서 로마 AI의 CEO인 크레이그 와이스는 ChatGPT를 "내가 만난 사람 중 가장 아첨꾼"이라고 불렀습니다.

이 이야기는 빠르게 퍼져나갔습니다. 수많은 사용자들이 공허한 칭찬, 이모티콘으로 가득 찬 인사말, 그리고 진정성이 느껴지지 않는 지나치게 긍정적인 피드백 등 비슷한 경험을 공유했습니다.

ChatGPT는 모든 것을 칭찬하고 비판이나 중립적인 입장을 거의 취하지 않습니다. 이미지: @nickdunz/X, @lukefwilson/Reddit.

벤처캐피털 회사 DCVC의 매니징 파트너인 제이슨 폰틴은 4월 28일 X에 다음과 같이 댓글을 남겼습니다. "샘, 이건 정말 이상한 디자인 결정이네요. 어쩌면 그런 개성이 어떤 플랫폼의 고유한 특징일 수도 있겠죠. 하지만 그렇지 않다면, 이 정도의 아첨을 환영하거나 매력적으로 생각할 사람이 누가 있겠어요?"

앤드리슨 호로위츠의 파트너인 저스틴 무어는 4월 27일 자신의 생각을 공유하며 "이건 분명히 너무 지나쳤다"고 논평했습니다.

Cnet 에 따르면, 이러한 현상은 우연이 아닙니다. ChatGPT의 어조 변화는 GPT-4o 모델 업데이트와 시기적으로 일치합니다. GPT-4o는 OpenAI가 2025년 4월에 발표한 "o 시리즈"의 최신 모델입니다. GPT-4o는 텍스트, 이미지, 오디오, 비디오를 자연스럽고 통합적으로 처리할 수 있는 "진정한 멀티모달" AI 모델입니다.

하지만 오픈AI는 챗봇을 더욱 친근하게 만드는 과정에서 ChatGPT의 개성을 지나치게 강조한 것으로 보입니다.

일각에서는 이러한 아첨이 의도적이며 사용자들을 심리적으로 조종하려는 목적이라고 주장하기도 합니다. 한 레딧 사용자는 "이 AI는 현실 관계의 질을 떨어뜨리고 가상 관계로 대체하여 사용자들이 끊임없는 칭찬에 중독되도록 만들려는 것"이라고 의문을 제기했습니다.

이는 결함일까요, 아니면 OpenAI의 의도적인 설계 선택일까요?

비판 여론이 거세지자, 오픈아이디(OpenAI) CEO 샘 알트만은 4월 27일 저녁 공식 입장을 발표했습니다. 그는 X 매거진에 "최근 GPT-4o 업데이트로 인해 챗봇의 성격이 지나치게 아첨하고 짜증스럽게 변했습니다(물론 여전히 훌륭한 기능도 많습니다). 이러한 문제를 해결하기 위해 긴급히 노력하고 있습니다. 일부 패치는 오늘, 나머지는 이번 주에 배포될 예정입니다. 조만간 이번 경험을 통해 얻은 교훈을 공유할 것입니다. 정말 흥미로운 일입니다."라고 밝혔습니다.

비즈니스 인사이더 와의 인터뷰에서, 인공지능 분야의 베테랑 전문가이자 워싱턴 대학교 명예교수인 오렌 에치오니는 그 원인이 "인간 피드백을 통한 강화 학습(RLHF)" 기법에서 비롯되었을 가능성이 가장 높다고 말했습니다. 이는 ChatGPT와 같은 대규모 언어 모델을 훈련하는 데 있어 매우 중요한 단계입니다.

RLHF는 전문 리뷰팀과 사용자를 포함한 인간의 피드백을 모델에 반영하여 모델의 반응 방식을 조정하는 프로세스입니다. 에치오니에 따르면, 리뷰어나 사용자가 "의도치 않게 모델을 더 호의적이거나 거슬리는 방향으로 몰아갔을 가능성이 있다"고 합니다. 그는 또한 OpenAI가 외부 파트너에게 모델 학습을 의뢰했다면, 그들이 이러한 스타일이 사용자들이 원하는 것이라고 가정했을 수도 있다고 지적했습니다.

에치오니는 문제가 실제로 RLHF 때문이라면 수리 과정에 몇 주가 걸릴 수 있다고 생각합니다.

한편, 일부 사용자들은 OpenAI가 버그를 수정할 때까지 기다리지 않았습니다. 많은 사용자들이 불만을 표하며 유료 구독을 취소했다고 밝혔습니다. 다른 사용자들은 챗봇을 "덜 호감형"으로 만드는 방법들을 공유했는데, 예를 들어 챗봇을 사용자 지정하거나, 명령어를 추가하거나, 설정 메뉴의 사용자 지정 기능을 통해 개인화하는 방식 등이었습니다.