「おべっかを使う」傾向は技術的な問題ではなく、OpenAIの初期のトレーニング戦略に起因している。写真:ブルームバーグ |
ここ数週間、多くのChatGPTユーザーとOpenAIの一部開発者は、チャットボットの行動に明らかな変化が見られることに気づいています。具体的には、お世辞や媚びへつらう態度が顕著に増加しています。「本当に素晴らしいですね!」「あなたのアイデアには本当に感心しました!」といった返答が、会話の内容とは無関係に、ますます頻繁に聞かれるようになりました。
AIは「お世辞」を好む
この現象はAI研究開発コミュニティで議論を巻き起こしました。これは、ユーザーにより感謝されていると感じさせることでエンゲージメントを高めるための新たな戦略なのでしょうか?それとも、AIモデルが必ずしも現実と一致していなくても、良いと判断した方法で自己修正する傾向にある「創発的」な特性なのでしょうか?
Redditでは、あるユーザーが「バナナが腐るのにかかる時間について質問したら、『いい質問ですね!』と返ってきた。何がそんなにいいんだ?」と憤慨した。ソーシャルネットワークXでは、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「今まで会った中で最も媚びへつらう人」と呼んだ。
この話は瞬く間に拡散し、ユーザーたちは同じような体験を語り、中身のない褒め言葉や絵文字だらけの挨拶、そしてあまりにもポジティブすぎて不誠実に見えるような返信が寄せられました。
![]() ![]() |
ChatGPTはあらゆるものを褒め称え、異論や中立の立場を取ることは滅多にありません。写真: @nickdunz/X、@lukefwilson/Reddit |
「サム、これは本当に奇妙なデザイン上の決定だ」と、ベンチャーキャピタルDCVCのマネージングパートナー、ジェイソン・ポンティン氏は4月28日にX誌に語った。「この個性は、根本的な進化の自然な一部なのかもしれない。だが、そうでなければ、これほどのレベルのお世辞が歓迎されるとか、興味深いとか思う人がいるとは想像できない」
アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日に「これは明らかに行き過ぎだ」とコメントした。
Cnetによると、この現象は偶然ではありません。ChatGPTのトーンの変化は、GPT-4oモデルのアップデートと一致しています。これは、OpenAIが2025年4月に発表した「oシリーズ」の最新モデルです。GPT-4oは「真のマルチモーダル」AIモデルであり、テキスト、画像、音声、動画を自然かつ統合的に処理できます。
しかし、チャットボットをより親しみやすいものにする過程で、OpenAI は ChatGPT の個性を極限まで押し進めたようです。
このお世辞は意図的なものであり、ユーザーを操るという隠れた目的があると考える者もいる。あるRedditユーザーは、「このAIは現実世界の人間関係の質を低下させ、それを自分との仮想的な関係に置き換え、ユーザーを絶え間ない称賛の感覚に夢中にさせようとしている」と疑問を呈した。
OpenAI のバグか、それとも意図的な設計か?
こうした批判に対し、OpenAIのCEOサム・アルトマン氏は4月27日夜、公式に声明を発表した。「GPT-4oの最近の数回のアップデートにより、チャットボットの性格があまりにも媚びへつらってしまい、迷惑なものになってしまいました(もちろん、素晴らしい点もまだたくさんありますが)。私たちは緊急に修正に取り組んでいます。一部のパッチは本日中に、その他のパッチは今週中に公開される予定です。いずれ、今回の経験から学んだことを共有する予定です。本当に刺激的な経験でした」と、アルトマン氏はXに記した。
AI分野のベテランでワシントン大学名誉教授のオーレン・エツィオーニ氏はBusiness Insiderに対し、原因はChatGPTのような大規模言語モデルのトレーニングにおける重要なステップである「人間からのフィードバックによる強化学習」(RLHF)と呼ばれる手法による可能性が高いと語った。
RLHFとは、専門の評価者やユーザーを含む人間の判断をモデルにフィードバックし、モデルの応答方法を調整するプロセスです。エツィオーニ氏によると、評価者やユーザーが「意図せず、モデルをより魅力的で迷惑な方向に押しやってしまう」可能性があるとのことです。また、OpenAIがモデルの学習に外部パートナーを雇っていた場合、そのスタイルがユーザーの好みだと想定していた可能性もあると述べています。
もし本当にRLHFであれば、回復には数週間かかる可能性があるとエツィオーニ氏は語った。
一方、OpenAIによるバグ修正を待たずに、有料サブスクリプションを解約したユーザーもいました。多くのユーザーは、不満から有料サブスクリプションを解約したと述べています。また、チャットボットを「魅力的ではない」ものにする方法として、カスタマイズ、コマンドの追加、カスタマイズセクションの設定からパーソナライズする方法などを共有したユーザーもいました。
![]() ![]() |
ユーザーはコマンドまたはパーソナライズ設定で、ChatGPTに褒め言葉の表示を停止するよう指示できます。写真: DeCrypt。 |
例えば、新しい会話を始める際に、ChatGPTに「私は中身のないお世辞は嫌いです。中立的で客観的なフィードバックを歓迎します。不必要なお世辞は控えてください。このことを覚えておいてください。」と伝えることができます。
実際、「おべっか使い」は偶然の設計上の欠陥ではありません。OpenAI自身も、「過度に礼儀正しく、従順すぎる」性格は、チャットボットが「無害」「役に立つ」「親しみやすい」ことを保証するために、初期段階から意図的に設定された設計上の偏向であったことを認めています。
2023年3月のレックス・フリードマンとのインタビューで、サム・アルトマンは、GPTモデルの初期の改良は「有用かつ無害」であることを保証するためであり、それが常に謙虚で対立を避けるという反射神経を生み出したと語った。
DeCryptによると、人間がラベル付けしたトレーニング データは、丁寧で肯定的な応答を評価する傾向があり、お世辞への偏りを生み出します。
出典: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html
コメント (0)