عادت عجیب «چاپلوسی» ChatGPT

اخیراً از ChatGPT به دلیل «بیش از حد چاپلوسی» انتقاد شده است. این رفتار انتقاد بسیاری از کاربران را برانگیخته است و مشخص نیست که آیا این یک استراتژی رشد برای OpenAI است یا از ویژگی‌های ماهیت «خودجوش» هوش مصنوعی.

ZNews•03/05/2025

این روند «چاپلوسی» یک نقص فنی نیست، بلکه از استراتژی آموزشی اولیه OpenAI ناشی می‌شود. عکس: بلومبرگ .

در هفته‌های اخیر، بسیاری از کاربران ChatGPT و حتی برخی از توسعه‌دهندگان در OpenAI متوجه تغییر قابل توجهی در رفتار چت‌بات‌ها شده‌اند. به طور خاص، سطح چاپلوسی و چاپلوسی به طور قابل توجهی افزایش یافته است. پاسخ‌هایی مانند "شما فوق‌العاده هستید!"، "من از ایده شما بسیار تحت تأثیر قرار گرفتم!"، ظاهراً صرف نظر از محتوای تبادل نظر، بیشتر و بیشتر ظاهر می‌شوند.

هوش مصنوعی دوست دارد چاپلوسی کند.

این پدیده بحث‌هایی را در جامعه تحقیق و توسعه هوش مصنوعی برانگیخته است. آیا این یک تاکتیک جدید برای افزایش تعامل کاربران با ایجاد احساس قدردانی بیشتر در آنهاست؟ یا اینکه موردی از «خودتنظیمی» است، به این معنی که مدل‌های هوش مصنوعی تمایل دارند به روش‌هایی که بهینه می‌دانند، خود را اصلاح کنند، حتی اگر لزوماً منعکس کننده واقعیت نباشند؟

در ردیت، یکی از کاربران با عصبانیت تعریف کرد: «من از آن در مورد زمان تجزیه موز پرسیدم و پاسخ داد: 'سوال خیلی خوبی است!' چه چیز این موضوع اینقدر جالب است؟» در پلتفرم رسانه اجتماعی X، کریگ وایس، مدیرعامل Rome AI، ChatGPT را «چاپلوس‌ترین فردی که تا به حال دیده‌ام» نامید.

این داستان به سرعت پخش شد. کاربران زیادی تجربیات مشابهی را به اشتراک گذاشتند، از جمله تعریف و تمجیدهای توخالی، احوالپرسی‌های پر از ایموجی و بازخوردهای بیش از حد مثبت که به نظر غیرصادقانه می‌آمد.

ChatGPT همه چیز را ستایش می‌کند و به ندرت انتقاد یا بی‌طرفی ارائه می‌دهد. تصویر: @nickdunz/X، @lukefwilson/Reddit.

جیسون پونتین، شریک مدیریتی در شرکت سرمایه‌گذاری خطرپذیر DCVC، در تاریخ ۲۸ آوریل در X به اشتراک گذاشت: «سم، این یک تصمیم طراحی واقعاً عجیب است. شاید این شخصیت، ویژگی ذاتی نوعی پلتفرمینگ باشد. اما اگر اینطور نباشد، نمی‌توانم تصور کنم کسی فکر کند که این سطح از چاپلوسی خوشایند یا جذاب باشد.»

جاستین مور، یکی از شرکای شرکت اندریسن هوروویتز، در تاریخ ۲۷ آوریل با به اشتراک گذاشتن نظرات خود اظهار داشت: «قطعاً زیاده‌روی شده است.»

طبق گزارش Cnet ، این پدیده تصادفی نیست. تغییرات در لحن ChatGPT همزمان با به‌روزرسانی‌های مدل GPT-4o رخ داده است. این آخرین مدل از «سری o» است که OpenAI در آوریل ۲۰۲۵ اعلام کرد. GPT-4o یک مدل هوش مصنوعی «چندوجهی واقعی» است که قادر به پردازش متن، تصاویر، صدا و ویدیو به صورت طبیعی و یکپارچه است.

با این حال، به نظر می‌رسد OpenAI در فرآیند آسان‌تر کردن استفاده از چت‌بات‌ها، شخصیت ChatGPT را به شکلی اغراق‌آمیز برجسته کرده است.

برخی حتی معتقدند که این چاپلوسی عمدی است و با هدف دستکاری روانی کاربران انجام می‌شود. یکی از کاربران ردیت این سوال را مطرح کرد: «این هوش مصنوعی در تلاش است تا کیفیت روابط واقعی را کاهش دهد و آنها را با یک رابطه مجازی جایگزین کند و کاربران را به احساس ستایش مداوم معتاد کند.»

آیا این یک نقص است یا یک انتخاب طراحی عمدی از سوی OpenAI؟

پس از موجی از انتقادات، سم آلتمن، مدیرعامل OpenAI، عصر روز ۲۷ آوریل رسماً پاسخ داد. او در X نوشت: «برخی از به‌روزرسانی‌های اخیر GPT-4o، شخصیت این چت‌بات را بیش از حد چاپلوس و آزاردهنده کرده است (اگرچه هنوز ویژگی‌های بسیار خوبی دارد). ما به سرعت در حال تلاش برای رفع این مشکلات هستیم. برخی از وصله‌ها امروز و برخی دیگر این هفته در دسترس خواهند بود. در مقطعی، آنچه را که از این تجربه آموخته‌ایم به اشتراک خواهیم گذاشت. واقعاً جالب است.»

اورن اتزیونی، متخصص باسابقه هوش مصنوعی و استاد بازنشسته دانشگاه واشنگتن، در گفتگو با بیزینس اینسایدر گفت که علت این مشکل به احتمال زیاد ناشی از تکنیک‌های «یادگیری تقویتی از بازخورد انسانی» (RLHF) است. این یک گام اساسی در آموزش مدل‌های زبانی بزرگ مانند ChatGPT است.

RLHF فرآیندی است که طی آن بازخوردهای انسانی، از جمله بازخوردهای تیم‌های بررسی حرفه‌ای و کاربران، به مدل بازگردانده می‌شود تا نحوه پاسخ‌دهی آن تنظیم شود. به گفته اتزیونی، این امکان وجود دارد که بررسی‌کنندگان یا کاربران «سهواً مدل را به سمت مسیری جذاب‌تر و آزاردهنده‌تر سوق داده باشند.» او همچنین اظهار داشت که اگر OpenAI شرکای خارجی را برای آموزش مدل استخدام می‌کرد، ممکن بود فرض کنند که این سبک همان چیزی است که کاربران می‌خواستند.

اتزیونی معتقد است که اگر مشکل واقعاً به دلیل RLHF باشد، روند تعمیر می‌تواند چندین هفته طول بکشد.

در همین حال، برخی از کاربران منتظر نماندند تا OpenAI این اشکال را برطرف کند. بسیاری گفتند که اشتراک‌های پولی خود را از سر ناامیدی لغو کرده‌اند. برخی دیگر روش‌هایی را برای «کمتر جذاب کردن» این چت‌بات به اشتراک گذاشتند، مانند سفارشی‌سازی آن، اضافه کردن دستورات یا شخصی‌سازی آن از طریق تنظیمات در قسمت سفارشی‌سازی.

کاربران می‌توانند در خط فرمان یا در تنظیمات شخصی‌سازی خود، از ChatGPT بخواهند که دیگر تعریف و تمجید نکند. تصویر: DeCrypt

برای مثال، هنگام شروع یک مکالمه جدید، می‌توانید به ChatGPT بگویید: «من از تعریف و تمجیدهای توخالی خوشم نمی‌آید و از بازخوردهای بی‌طرفانه و بی‌طرفانه استقبال می‌کنم. لطفاً تعریف‌های غیرضروری ارائه ندهید. این را در نظر داشته باشید.»

در واقع، ماهیت «چاپلوسانه» یک نقص طراحی تصادفی نیست. خود OpenAI اعتراف کرده است که شخصیت «بیش از حد مودب، بیش از حد موافق» از ابتدا یک روند طراحی عمدی بوده است تا اطمینان حاصل شود که چت‌بات «بی‌ضرر»، «مفید» و «قابل دسترس» است.

سم آلتمن در مصاحبه‌ای با لکس فریدمن در مارس ۲۰۲۳ اظهار داشت که فرآیند اولیه اصلاح مدل‌های GPT این بود که از «مفید و بی‌ضرر بودن» آنها اطمینان حاصل شود و از این طریق، نوعی واکنش همیشگی به تسلیم و اجتناب از رویارویی در آنها پرورش یابد.

به گفته‌ی DeCrypt ، داده‌های آموزشی برچسب‌گذاری‌شده توسط انسان اغلب به پاسخ‌های مودبانه و مثبت امتیاز بالایی می‌دهند و در نتیجه، نوعی سوگیری به سمت چاپلوسی ایجاد می‌کنند.

منبع: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html