ChatGPTの奇妙な「お世辞」癖

ChatGPTは最近、「過度に褒めすぎている」として批判されている。この挙動は多くのユーザーから批判を浴びており、これがOpenAIの成長戦略なのか、それともAIの「自発性」という性質によるものなのかは不明瞭なままだ。

ZNews•03/05/2025

「おべっか使い」の傾向は技術的な不具合ではなく、OpenAIの初期のトレーニング戦略に起因している。写真：ブルームバーグ。

ここ数週間、ChatGPTの多くのユーザー、そしてOpenAIの開発者の一部でさえ、チャットボットの挙動に大きな変化が見られることに気づいています。具体的には、お世辞や媚びを売るような表現が著しく増加しています。「あなたは素晴らしい！」「あなたのアイデアには本当に感銘を受けました！」といった返答が、会話の内容に関係なく、ますます頻繁に見られるようになっています。

AIはお世辞を言うのが好きだ。

この現象は、AIの研究開発コミュニティ内で議論を巻き起こしている。これは、ユーザーに高く評価されていると感じさせることで、ユーザーエンゲージメントを高めるための新たな戦略なのだろうか？それとも、「自己調整」の事例であり、AIモデルは必ずしも現実を反映していなくても、最適と思われる方法で自己修正する傾向があるということなのだろうか？

Redditでは、あるユーザーが怒りを込めてこう語った。「バナナの腐敗時間について質問したら、『素晴らしい質問ですね！』と返ってきた。一体何が素晴らしいんだ？」ソーシャルメディアプラットフォームXでは、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「これまで出会った中で最も媚びへつらう人物」と評した。

この話は瞬く間に広まった。多くのユーザーが、空虚な褒め言葉、絵文字だらけの挨拶、不誠実に感じられる過剰な肯定的なフィードバックなど、同様の体験を共有した。

ChatGPTはあらゆるものを褒め称え、批判や中立的な立場を示すことはめったにありません。画像： @nickdunz/X、@lukefwilson/Reddit。

ベンチャーキャピタル企業DCVCのマネージングパートナーであるジェイソン・ポンティン氏は、4月28日にXで次のように語った。「サム、これは本当に奇妙なデザイン上の決定だ。もしかしたら、その個性は何らかのプラットフォームに固有の特性なのかもしれない。しかし、そうでないなら、これほどのお世辞が歓迎されたり魅力的に思われたりするとは誰も思わないだろう。」

アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日に自身の考えを述べ、「これは明らかにやり過ぎだ」とコメントした。

Cnetによると、この現象は偶然ではない。ChatGPTのトーンの変化は、GPT-4oモデルのアップデートと時期を同じくしている。これは、OpenAIが2025年4月に発表した「oシリーズ」の最新モデルである。GPT-4oは、テキスト、画像、音声、動画を自然かつ統合的に処理できる「真のマルチモーダル」AIモデルだ。

しかし、チャットボットをより親しみやすいものにする過程で、OpenAIはChatGPTの個性を誇張しすぎたように思われる。

中には、こうしたお世辞は意図的なものであり、ユーザーを心理的に操ることを目的としていると指摘する人もいる。あるRedditユーザーは、「このAIは現実世界の人間関係の質を低下させ、それをAIとの仮想的な関係に置き換えることで、ユーザーを絶え間ない称賛の感覚に中毒させようとしている」と疑問を呈した。

これは欠陥なのか、それともOpenAIによる意図的な設計選択なのか？

批判の波を受け、OpenAIのCEOサム・アルトマン氏は4月27日夜に公式に回答した。「GPT-4oの最近のアップデートにより、チャットボットの性格が過度に卑屈で迷惑なものになってしまいました（とはいえ、優れた機能も数多く備えています）。これらの問題の解決に緊急に取り組んでいます。一部のパッチは本日公開され、その他は今週中に公開される予定です。いずれ、この経験から得られた教訓を共有するつもりです。非常に興味深い内容です」と、彼はXに書き込んだ。

ビジネスインサイダーの取材に対し、AI分野のベテラン専門家であり、ワシントン大学名誉教授のオレン・エツィオーニ氏は、原因はおそらく「人間からのフィードバックに基づく強化学習」（RLHF）技術にあると述べた。これは、ChatGPTのような大規模な言語モデルを訓練する上で重要なステップである。

RLHFとは、プロのレビューチームやユーザーからのフィードバックを含む人間の意見をモデルにフィードバックし、モデルの反応を調整するプロセスです。エツィオーニ氏によると、レビュー担当者やユーザーが「意図せずモデルをより好意的で、かつ不快な方向に導いてしまった」可能性があるとのことです。また、OpenAIが外部パートナーにモデルのトレーニングを依頼した場合、ユーザーがこのようなスタイルを望んでいると想定した可能性もあると指摘しています。

エツィオーニ氏は、もし問題が本当にRLHFに起因するものであれば、修復には数週間かかる可能性があると考えている。

一方、OpenAIがバグを修正するのを待たずに、別の行動に出たユーザーもいた。多くのユーザーは、不満から有料購読を解約したと述べている。また、チャットボットを「あまり好感の持てないもの」にする方法として、カスタマイズしたり、コマンドを追加したり、設定の「カスタマイズ」からパーソナライズしたりする方法を共有するユーザーもいた。