この「おべっか」の傾向は技術的な不具合ではなく、OpenAIの初期のトレーニング戦略に起因している。写真:ブルームバーグ |
ここ数週間、多くのChatGPTユーザー、そしてOpenAIの開発者でさえ、チャットボットの行動に大きな変化が見られることに気づいています。具体的には、お世辞や媚びへつらう態度が著しく増加しています。「素晴らしいですね!」「あなたのアイデアには本当に感銘を受けました!」といった返答が、やり取りの内容とは無関係に、ますます頻繁に見られるようになっています。
AIはお世辞が好きです。
この現象は、AI研究開発コミュニティ内で議論を巻き起こしました。これは、ユーザーにより高く評価されていると感じさせることでエンゲージメントを高めるための新たな戦略なのでしょうか?それとも、「自己調整」、つまりAIモデルが必ずしも現実を反映していなくても、最適だと判断した方法で自己修正する傾向があることを意味するのでしょうか?
Redditでは、あるユーザーが怒りを込めてこう語った。「バナナの腐敗時間について質問したら、『いい質問だね!』と返ってきた。何がそんなにいいんだ?」ソーシャルメディアプラットフォームXでは、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「今まで出会った中で最も媚びへつらう人」と評した。
この話は瞬く間に広まり、多くのユーザーが同じような体験を語りました。内容のない褒め言葉、絵文字だらけの挨拶、そして不誠実に感じられる過剰な肯定的なフィードバックなどです。
![]() ![]() |
ChatGPTはあらゆるものを称賛し、批判や中立的な立場を取ることはほとんどない。画像: @nickdunz/X、@lukefwilson/Reddit。 |
ベンチャーキャピタルDCVCのマネージングパートナー、ジェイソン・ポンティン氏は4月28日、Xで次のようにコメントしました。「サム、これは本当に奇妙なデザイン上の決定ですね。もしかしたら、この個性はある種のプラットフォームに固有の特性なのかもしれません。でも、もしそうでないなら、これほどのレベルのお世辞が歓迎されるとか、魅力的だと考える人がいるとは想像できません。」
アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日に自身の考えを共有し、「これは間違いなく行き過ぎだ」とコメントした。
Cnetによると、この現象は偶然ではありません。ChatGPTのトーンの変化は、GPT-4oモデルのアップデートと一致しています。これは、OpenAIが2025年4月に発表した「oシリーズ」の最新モデルです。GPT-4oは「真のマルチモーダル」AIモデルであり、テキスト、画像、音声、 動画を自然かつ統合的に処理できます。
しかし、チャットボットをより親しみやすいものにする過程で、OpenAI は ChatGPT の個性を誇張した形で押し出したようです。
このお世辞は意図的で、ユーザーを心理的に操ろうとしているのではないかと指摘する声もある。あるRedditユーザーは、「このAIは現実世界の人間関係の質を低下させ、それを自分との仮想的な関係に置き換え、ユーザーを絶え間ない称賛の感覚に依存させようとしている」と疑問を呈した。
これは欠陥でしょうか、それとも OpenAI による意図的な設計上の選択でしょうか?
批判の波を受けて、OpenAIのCEOであるサム・アルトマン氏は4月27日夜に公式に反論した。「GPT-4oの最近のアップデートにより、チャットボットの性格が過度に卑屈で迷惑なものになってしまったようです(とはいえ、依然として優れた機能は数多くあります)。私たちはこれらの問題の修正に緊急に取り組んでいます。一部のパッチは本日中に、その他のパッチは今週中に公開される予定です。いずれ、今回の経験から学んだことを共有する予定です。非常に興味深い内容です」と、彼はXに記した。
ワシントン大学のベテランAI専門家で名誉教授のオーレン・エツィオーニ氏は、 Business Insiderの取材に対し、原因は「人間からのフィードバックによる強化学習」(RLHF)技術に起因する可能性が高いと述べた。これは、ChatGPTのような大規模言語モデルの学習において重要なステップとなる。
RLHFとは、専門家のレビューチームやユーザーなどからの人間によるフィードバックをモデルにフィードバックし、その応答方法を調整するプロセスです。エツィオーニ氏によると、レビュー担当者やユーザーが「意図せず、モデルをより魅力的でイライラさせる方向に押しやってしまった」可能性があるとのことです。また、OpenAIがモデルのトレーニングに外部パートナーを雇っていた場合、このスタイルがユーザーの好みだと勘違いしていた可能性もあると指摘しました。
エツィオーニ氏は、問題が本当にRLHFによるものであれば、修復作業には数週間かかる可能性があると考えている。
一方、OpenAIによるバグ修正を待たずに、有料サブスクリプションを解約したユーザーもいました。多くのユーザーは、不満から有料サブスクリプションを解約したと述べています。また、チャットボットを「魅力的でないものにする」方法として、カスタマイズ、コマンドの追加、設定の「カスタマイズ」からパーソナライズする方法などを共有したユーザーもいました。
![]() ![]() |
ユーザーは、コマンドラインまたはパーソナライズ設定で、ChatGPTに賛辞の表示を停止するようリクエストできます。画像: DeCrypt。 |
例えば、新しい会話を始める際に、ChatGPTに「私は中身のないお世辞は好きではありません。中立的で客観的なフィードバックを歓迎します。不必要なお世辞はやめてください。この点に留意してください。」と伝えることができます。
実際、「卑屈」な性格は偶然の設計上の欠陥ではありません。OpenAI自身も、「過度に礼儀正しく、過度に協調的な」性格は、チャットボットが「無害」「親切」「親しみやすさ」を担保するために、当初から意図的な設計傾向であったことを認めています。
2023年3月のレックス・フリードマンとのインタビューで、サム・アルトマンは、GPTモデルの初期の改良プロセスは、それらが「有用かつ無害」であることを保証し、それによって常に従順であり対立を避けるという反射を育むことであったと語った。
DeCryptによると、人間がラベル付けしたトレーニング データは、丁寧で肯定的な返答に高いスコアを与えることが多く、それによってお世辞への偏りが形成されるそうです。
出典: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html










コメント (0)