「おべっか使い」の傾向は技術的な不具合ではなく、OpenAIの初期のトレーニング戦略に起因している。写真:ブルームバーグ。 |
ここ数週間、ChatGPTの多くのユーザー、そしてOpenAIの開発者の一部でさえ、チャットボットの挙動に大きな変化が見られることに気づいています。具体的には、お世辞や媚びを売るような表現が著しく増加しています。「あなたは素晴らしい!」「あなたのアイデアには本当に感銘を受けました!」といった返答が、会話の内容に関係なく、ますます頻繁に見られるようになっています。
AIはお世辞を言うのが好きだ。
この現象は、AIの研究開発コミュニティ内で議論を巻き起こしている。これは、ユーザーに高く評価されていると感じさせることで、ユーザーエンゲージメントを高めるための新たな戦略なのだろうか?それとも、「自己調整」の事例であり、AIモデルは必ずしも現実を反映していなくても、最適と思われる方法で自己修正する傾向があるということなのだろうか?
Redditでは、あるユーザーが怒りを込めてこう語った。「バナナの腐敗時間について質問したら、『素晴らしい質問ですね!』と返ってきた。一体何が素晴らしいんだ?」ソーシャルメディアプラットフォームXでは、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「これまで出会った中で最も媚びへつらう人物」と評した。
この話は瞬く間に広まった。多くのユーザーが、空虚な褒め言葉、絵文字だらけの挨拶、不誠実に感じられる過剰な肯定的なフィードバックなど、同様の体験を共有した。
![]() ![]() |
ChatGPTはあらゆるものを褒め称え、批判や中立的な立場を示すことはめったにありません。画像: @nickdunz/X、@lukefwilson/Reddit。 |
ベンチャーキャピタル企業DCVCのマネージングパートナーであるジェイソン・ポンティン氏は、4月28日にXで次のように語った。「サム、これは本当に奇妙なデザイン上の決定だ。もしかしたら、その個性は何らかのプラットフォームに固有の特性なのかもしれない。しかし、そうでないなら、これほどのお世辞が歓迎されたり魅力的に思われたりするとは誰も思わないだろう。」
アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日に自身の考えを述べ、「これは明らかにやり過ぎだ」とコメントした。
Cnetによると、この現象は偶然ではない。ChatGPTのトーンの変化は、GPT-4oモデルのアップデートと時期を同じくしている。これは、OpenAIが2025年4月に発表した「oシリーズ」の最新モデルである。GPT-4oは、テキスト、画像、音声、 動画を自然かつ統合的に処理できる「真のマルチモーダル」AIモデルだ。
しかし、チャットボットをより親しみやすいものにする過程で、OpenAIはChatGPTの個性を誇張しすぎたように思われる。
中には、こうしたお世辞は意図的なものであり、ユーザーを心理的に操ることを目的としていると指摘する人もいる。あるRedditユーザーは、「このAIは現実世界の人間関係の質を低下させ、それをAIとの仮想的な関係に置き換えることで、ユーザーを絶え間ない称賛の感覚に中毒させようとしている」と疑問を呈した。
これはOpenAIのエラーなのか、それとも意図的な設計なのか?
批判の波を受け、OpenAIのCEOサム・アルトマン氏は4月27日夜に公式に回答した。「GPT-4oの最近のアップデートにより、チャットボットの性格が過度に卑屈で迷惑なものになってしまいました(とはいえ、優れた機能も数多く備えています)。これらの問題の解決に緊急に取り組んでいます。一部のパッチは本日公開され、その他は今週中に公開される予定です。いずれ、この経験から得られた教訓を共有するつもりです。非常に興味深い内容です」と、彼はXに書き込んだ。
ビジネスインサイダーの取材に対し、AI分野のベテラン専門家であり、ワシントン大学名誉教授のオレン・エツィオーニ氏は、原因はおそらく「人間からのフィードバックに基づく強化学習」(RLHF)技術にあると述べた。これは、ChatGPTのような大規模な言語モデルを訓練する上で重要なステップである。
RLHFとは、プロのレビューチームやユーザーからのフィードバックを含む人間の意見をモデルにフィードバックし、モデルの反応を調整するプロセスです。エツィオーニ氏によると、レビュー担当者やユーザーが「意図せずモデルをより好意的で、かつ不快な方向に導いてしまった」可能性があるとのことです。また、OpenAIが外部パートナーにモデルのトレーニングを依頼した場合、ユーザーがこのようなスタイルを望んでいると想定した可能性もあると指摘しています。
エツィオーニ氏は、もし問題が本当にRLHFに起因するものであれば、修復には数週間かかる可能性があると考えている。
一方、OpenAIがバグを修正するのを待たずに、別の行動に出たユーザーもいた。多くのユーザーは、不満から有料購読を解約したと述べている。また、チャットボットを「あまり好感の持てないもの」にする方法として、カスタマイズしたり、コマンドを追加したり、設定の「カスタマイズ」からパーソナライズしたりする方法を共有するユーザーもいた。
![]() ![]() |
ユーザーは、コマンドラインまたはパーソナライズ設定で、ChatGPTが褒め言葉を送信しないようにリクエストできます。画像: DeCrypt。 |
例えば、新しい会話を始める際に、ChatGPTに「私は空虚なお世辞は好きではありません。中立的で客観的なフィードバックを歓迎します。不必要な褒め言葉は控えてください。この点にご留意ください。」と伝えることができます。
実際、この「へつらい」な性質は、偶然の設計上の欠陥ではありません。OpenAI自身も、「過度に丁寧で、過度に従順」な性格は、チャットボットが「無害」で、「役に立ち」、「親しみやすい」ものとなるよう、当初から意図的に設計されたものであると認めています。
2023年3月にレックス・フリッドマンとのインタビューで、サム・アルトマンは、GPTモデルの初期改良プロセスは「有用かつ無害」であることを保証することであり、それによって常に従順であり、対立を避けるという反射的な行動を促すことだったと語った。
DeCryptによると、人間がラベル付けしたトレーニングデータは、丁寧で肯定的な応答に高いスコアを与えることが多く、それによってお世辞に対するバイアスが形成されるという。
出典:https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html










コメント (0)