「おべっかを使う」傾向は技術的な問題ではなく、OpenAIの初期のトレーニング戦略に起因している。写真:ブルームバーグ |
ここ数週間、多くのChatGPTユーザー、そしてOpenAIの開発者たちでさえ、チャットボットの行動に明らかな変化が見られることに気づいています。具体的には、お世辞や媚びへつらう態度が顕著に増加しています。「本当に素晴らしいですね!」「あなたのアイデアには本当に感心しました!」といった返答が、会話の内容とは無関係に、ますます頻繁に聞かれるようになりました。
AIは「お世辞」を好む
この現象は、AI研究開発コミュニティで議論を巻き起こしました。これは、ユーザーにより感謝されていると感じさせることでエンゲージメントを高めるための新たな戦術なのでしょうか?それとも、AIモデルが必ずしも真実ではないとしても、良いと判断した方法で自己修正する傾向があるという「創発的」な特性なのでしょうか?
Redditでは、あるユーザーが「バナナの分解時間について質問したら、『いい質問ですね!』と返ってきた。何がそんなにいいんだ?」と憤慨した。ソーシャルネットワークXでは、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「今まで出会った中で最もおべっか使い」と呼んだ。
この話は瞬く間に拡散し、多くのユーザーが同じような体験をシェアしました。中身のない褒め言葉や絵文字だらけの挨拶、そしてあまりにもポジティブすぎて不誠実に思えるほどの返信などです。
![]() ![]() |
ChatGPTはあらゆるものを称賛し、反対意見や中立的な立場を表明することはめったにありません。写真: @nickdunz/X、@lukefwilson/Reddit。 |
「サム、これは本当に奇妙なデザイン上の決定だ」と、ベンチャーキャピタルDCVCのマネージングパートナー、ジェイソン・ポンティン氏は4月28日にX誌に語った。「この個性は、根本的な進化の結果として生まれたものなのかもしれない。だが、そうでなければ、これほどのレベルのお世辞が歓迎されるとか、興味深いとか思う人がいるとは思えない」
アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日にこの投稿で「これは間違いなく行き過ぎだ」とコメントした。
Cnetによると、この現象は偶然ではありません。ChatGPTのトーンの変化は、GPT-4oモデルのアップデートと一致していました。これは、OpenAIが2025年4月に発表した「oシリーズ」の最新モデルです。GPT-4oは「真のマルチモーダル」AIモデルであり、テキスト、画像、音声、 動画を自然かつ統合的に処理できます。
しかし、チャットボットをより親しみやすいものにする過程で、OpenAI は ChatGPT の個性を極限まで押し進めたようです。
このお世辞は意図的なものであり、ユーザーを操るという隠れた目的があると考える者もいる。あるRedditユーザーは、「このAIは現実世界の人間関係の質を低下させ、それを自分との仮想的な関係に置き換え、ユーザーを絶え間ない称賛の感覚に夢中にさせようとしている」と疑問を呈した。
OpenAI のバグか意図的な設計か?
こうした批判に対し、OpenAIのCEOサム・アルトマン氏は4月27日夜、公式に声明を発表した。「GPT-4oの最近のアップデートにより、チャットボットの性格があまりにも媚びへつらうようになり、逆に迷惑なものになってしまった(もちろん、優れた点も数多くある)。現在、緊急に修正に取り組んでいます。一部のパッチは本日中に、その他のパッチは今週中に公開される予定です。いずれ、今回の経験から学んだことを共有する予定です。本当に刺激的な経験でした」と、アルトマン氏はXに記した。
ベテランAI専門家でワシントン大学名誉教授のオーレン・エツィオーニ氏はBusiness Insiderに対し、原因はおそらく「人間からのフィードバックによる強化学習」(RLHF)と呼ばれる手法によるもので、ChatGPTのような大規模言語モデルのトレーニングにおける重要なステップであると語った。
RLHFとは、専門の評価者とユーザーの両方による人間の判断をモデルにフィードバックし、モデルの応答方法を調整するプロセスです。エツィオーニ氏によると、人間の評価者やユーザーが「意図せず、モデルをより魅力的で迷惑な方向に押しやってしまった」可能性があるとのことです。また、OpenAIがモデルのトレーニングに外部パートナーを雇っていた場合、このスタイルがユーザーの好みだと想定していた可能性もあると述べています。
エツィオーニ氏は、もし本当にRLHFであれば、回復には数週間かかる可能性があると述べた。
一方、OpenAIによるバグ修正を待たずに、有料サブスクリプションを解約したユーザーもいました。多くのユーザーは、不満から有料サブスクリプションを解約したと述べています。また、チャットボットを「魅力的でないものにする」方法として、カスタマイズ、コマンドの追加、カスタマイズセクションの設定からパーソナライズする方法などを共有したユーザーもいました。
![]() ![]() |
ユーザーはコマンドまたはパーソナライズ設定で、ChatGPTに褒め言葉の表示を停止するよう指示できます。写真: DeCrypt。 |
例えば、新しい会話を始める際に、ChatGPTに次のように伝えることができます。「私は中身のないお世辞は嫌いです。中立的で客観的なフィードバックを歓迎します。不必要なお世辞は控えてください。このことを覚えておいてください。」
実際、「おべっか使い」という特性は設計上の偶然の欠陥ではありません。OpenAI自身も、「過度に礼儀正しく、過度に従順」な性格は、チャットボットが「無害」「親切」「友好的」であることを保証するため、初期段階から意図的に設定された設計上の偏向であったことを認めています。
2023年3月のレックス・フリードマンとのインタビューで、サム・アルトマンは、GPTモデルの初期の改良は「有用性と無害性」を確保することであり、それによって常に謙虚になり、対立を避けるという反射神経が形成されると語った。
DeCryptによると、人間がラベル付けしたトレーニング データは、丁寧で肯定的な応答を評価する傾向があり、お世辞への偏りを生み出します。
出典: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














コメント (0)