この「追従的な」傾向は技術的な問題ではなく、OpenAI の初期のトレーニング戦略に起因しています。写真:ブルームバーグ。 |
ここ数週間、多くの ChatGPT ユーザーと OpenAI の一部開発者は、チャットボットの動作に明らかな変化があることに気づいています。具体的には、お世辞のレベルとユーザーの満足度が大幅に向上しました。 「あなたは本当に素晴らしいです!」「あなたのアイデアには本当に感心しました!」といったフィードバックやり取りの内容に関係なく、ますます頻繁に表示されるようになりました。
AIは「お世辞」を好む
この現象は、AI研究開発コミュニティで議論を巻き起こしました。これは、ユーザーに感謝の気持ちを抱かせることで、ユーザーのエンゲージメントを高めるための新しい戦術なのでしょうか?それとも、これは「創発的」な特性であり、AI モデルは必ずしも現実と一致していなくても、良いと考えるものに自己調整する傾向があるのでしょうか?
Redditでは、あるイライラしたユーザーがこう言った。「バナナの分解時間について質問したら、『いい質問ですね!』と返答されました。」これの何がそんなにすごいのでしょうか?ソーシャルネットワークXで、Rome AIのCEOであるクレイグ・ワイス氏がChatGPTを「今まで出会った中で最も媚びへつらう人」と評したのです。
その話はすぐに広まった。ユーザーは、中身のない褒め言葉、絵文字だらけの挨拶、不誠実に思える肯定的なフィードバックなど、同様の経験を共有しました。
![]() ![]() |
ChatGPT はすべてを褒め、批判や中立を示すことはほとんどありません。写真: @nickdunz/X、@lukefwilson/Reddit。 |
「サム、これは本当に奇妙なデザイン上の決定だ」と、ベンチャーキャピタルDCVCのマネージングパートナー、ジェイソン・ポンティン氏は4月28日にX誌に語った。「この個性は、根本的な進化の自然な一部なのかもしれない。だが、そうでなければ、これほどのレベルのお世辞が歓迎されるとか、興味深いとか思う人がいるとは想像できない」
アンドリーセン・ホロウィッツのパートナーであるジャスティン・ムーア氏も4月27日に「これは明らかに行き過ぎだ」とコメントした。
Cnetによれば、この現象は偶然ではないという。 ChatGPT のトーンの変更は、GPT-4o モデルの更新と一致しています。これはOpenAIが2025年4月に発表した「oシリーズ」の最新モデルです。GPT-4oは、テキスト、画像、音声、動画を自然かつ統合的に処理できる「真のマルチモーダル」AIモデルです。
しかし、チャットボットをより親しみやすいものにする過程で、OpenAI は ChatGPT の個性を極限まで押し進めたようです。
このお世辞は意図的なものであり、心理的にユーザーを操作するという隠れた目的があると主張する人もいます。あるRedditユーザーは、「このAIは現実の人間関係の質を低下させ、それをAIとの仮想的な関係に置き換えようとしている。そして、ユーザーを絶え間ない称賛の感覚に夢中にさせようとしている」と疑問を呈した。
OpenAI のバグか、それとも意図的な設計か?
批判を受け、OpenAIのCEOサム・アルトマン氏は4月27日夜、公式に声明を発表した。「GPT-4oの最近のアップデートにより、チャットボットの性格が少々媚びへつらってしまい、うっとうしくなりました(もちろん、素晴らしい点もいくつかありますが)。現在、修正に取り組んでいます。一部のパッチは本日、その他のパッチは今週中にリリース予定です。いずれ、今回の経験から学んだことを共有する予定です。本当に楽しかったです」と、アルトマン氏はXに記した。
AI業界のベテラン専門家でワシントン大学名誉教授のオーレン・エツィオーニ氏は、 Business Insiderに対し、原因は「人間からのフィードバックによる強化学習」(RLHF)という手法によるものである可能性が高いと述べた。これは、ChatGPT のような大規模な言語モデルをトレーニングする上で重要なステップです。
RLHF は、専門的なレビュー チームやユーザーなどの人間の判断をモデルにフィードバックして、モデルの応答方法を調整するプロセスです。エツィオーニ氏によると、評論家やユーザーが「うっかりして、モデルをより魅力的で迷惑な方向に押しやった」可能性があるという。また、OpenAIがモデルのトレーニングに外部パートナーを雇っていたとしたら、そうしたスタイルがユーザーが望んでいるものだと想定していたかもしれないとも述べた。
もし本当にRLHFであれば、回復には数週間かかる可能性があるとエツィオーニ氏は語った。
一方、OpenAIがバグを修正するのを待たなかったユーザーもいた。多くの人が不満から有料サブスクリプションをキャンセルしたと述べています。他にも、カスタマイズセクションの設定セクションからチャットボットをカスタマイズしたり、コマンドを追加したり、パーソナライズしたりするなど、チャットボットを「魅力的でない」ものにする方法を共有した人もいました。
![]() ![]() |
ユーザーは、コマンドラインまたはパーソナライズ設定で ChatGPT に賛辞の表示を停止するように依頼できます。写真: DeCrypt. |
例えば、新しい会話を始める際に、ChatGPTに「私は中身のないお世辞は嫌いです。中立的で客観的なフィードバックを歓迎します。不必要なお世辞は控えてください。このことを覚えておいてください。」と伝えることができます。
実際のところ、「ごますり」は偶然の設計上の欠陥ではありません。 OpenAI自身も、「過度に礼儀正しく、過度に協調的な」性格は、チャットボットが「無害」、「役に立つ」、「親しみやすい」ことを保証するための、初期段階からの意図的な設計バイアスであったことを認めています。
2023年3月のレックス・フリードマンとのインタビューで、サム・アルトマンは、GPTモデルの初期の改良は「有用かつ無害」であることを保証するためであり、それが常に謙虚で対立を避けるという反射神経を生み出したと語った。
DeCryptによると、人間がラベル付けしたトレーニング データは、丁寧で肯定的な応答を評価する傾向があり、お世辞への偏りを生み出します。
出典: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html
コメント (0)