این روند «چاپلوسی» یک نقص فنی نیست، بلکه از استراتژی آموزشی اولیه OpenAI ناشی میشود. عکس: بلومبرگ . |
در هفتههای اخیر، بسیاری از کاربران ChatGPT و حتی برخی از توسعهدهندگان در OpenAI متوجه تغییر قابل توجهی در رفتار چتباتها شدهاند. به طور خاص، سطح چاپلوسی و چاپلوسی به طور قابل توجهی افزایش یافته است. پاسخهایی مانند "شما فوقالعاده هستید!"، "من از ایده شما بسیار تحت تأثیر قرار گرفتم!"، ظاهراً صرف نظر از محتوای تبادل نظر، بیشتر و بیشتر ظاهر میشوند.
هوش مصنوعی دوست دارد چاپلوسی کند.
این پدیده بحثهایی را در جامعه تحقیق و توسعه هوش مصنوعی برانگیخته است. آیا این یک تاکتیک جدید برای افزایش تعامل کاربران با ایجاد احساس قدردانی بیشتر در آنهاست؟ یا اینکه موردی از «خودتنظیمی» است، به این معنی که مدلهای هوش مصنوعی تمایل دارند به روشهایی که بهینه میدانند، خود را اصلاح کنند، حتی اگر لزوماً منعکس کننده واقعیت نباشند؟
در ردیت، یکی از کاربران با عصبانیت تعریف کرد: «من از آن در مورد زمان تجزیه موز پرسیدم و پاسخ داد: 'سوال خیلی خوبی است!' چه چیز این موضوع اینقدر جالب است؟» در پلتفرم رسانه اجتماعی X، کریگ وایس، مدیرعامل Rome AI، ChatGPT را «چاپلوسترین فردی که تا به حال دیدهام» نامید.
این داستان به سرعت پخش شد. کاربران زیادی تجربیات مشابهی را به اشتراک گذاشتند، از جمله تعریف و تمجیدهای توخالی، احوالپرسیهای پر از ایموجی و بازخوردهای بیش از حد مثبت که به نظر غیرصادقانه میآمد.
![]() ![]() |
ChatGPT همه چیز را ستایش میکند و به ندرت انتقاد یا بیطرفی ارائه میدهد. تصویر: @nickdunz/X، @lukefwilson/Reddit. |
جیسون پونتین، شریک مدیریتی در شرکت سرمایهگذاری خطرپذیر DCVC، در تاریخ ۲۸ آوریل در X به اشتراک گذاشت: «سم، این یک تصمیم طراحی واقعاً عجیب است. شاید این شخصیت، ویژگی ذاتی نوعی پلتفرمینگ باشد. اما اگر اینطور نباشد، نمیتوانم تصور کنم کسی فکر کند که این سطح از چاپلوسی خوشایند یا جذاب باشد.»
جاستین مور، یکی از شرکای شرکت اندریسن هوروویتز، در تاریخ ۲۷ آوریل با به اشتراک گذاشتن نظرات خود اظهار داشت: «قطعاً زیادهروی شده است.»
طبق گزارش Cnet ، این پدیده تصادفی نیست. تغییرات در لحن ChatGPT همزمان با بهروزرسانیهای مدل GPT-4o رخ داده است. این آخرین مدل از «سری o» است که OpenAI در آوریل ۲۰۲۵ اعلام کرد. GPT-4o یک مدل هوش مصنوعی «چندوجهی واقعی» است که قادر به پردازش متن، تصاویر، صدا و ویدیو به صورت طبیعی و یکپارچه است.
با این حال، به نظر میرسد OpenAI در فرآیند آسانتر کردن استفاده از چتباتها، شخصیت ChatGPT را به شکلی اغراقآمیز برجسته کرده است.
برخی حتی معتقدند که این چاپلوسی عمدی است و با هدف دستکاری روانی کاربران انجام میشود. یکی از کاربران ردیت این سوال را مطرح کرد: «این هوش مصنوعی در تلاش است تا کیفیت روابط واقعی را کاهش دهد و آنها را با یک رابطه مجازی جایگزین کند و کاربران را به احساس ستایش مداوم معتاد کند.»
آیا این یک نقص است یا یک انتخاب طراحی عمدی از سوی OpenAI؟
پس از موجی از انتقادات، سم آلتمن، مدیرعامل OpenAI، عصر روز ۲۷ آوریل رسماً پاسخ داد. او در X نوشت: «برخی از بهروزرسانیهای اخیر GPT-4o، شخصیت این چتبات را بیش از حد چاپلوس و آزاردهنده کرده است (اگرچه هنوز ویژگیهای بسیار خوبی دارد). ما به سرعت در حال تلاش برای رفع این مشکلات هستیم. برخی از وصلهها امروز و برخی دیگر این هفته در دسترس خواهند بود. در مقطعی، آنچه را که از این تجربه آموختهایم به اشتراک خواهیم گذاشت. واقعاً جالب است.»
اورن اتزیونی، متخصص باسابقه هوش مصنوعی و استاد بازنشسته دانشگاه واشنگتن، در گفتگو با بیزینس اینسایدر گفت که علت این مشکل به احتمال زیاد ناشی از تکنیکهای «یادگیری تقویتی از بازخورد انسانی» (RLHF) است. این یک گام اساسی در آموزش مدلهای زبانی بزرگ مانند ChatGPT است.
RLHF فرآیندی است که طی آن بازخوردهای انسانی، از جمله بازخوردهای تیمهای بررسی حرفهای و کاربران، به مدل بازگردانده میشود تا نحوه پاسخدهی آن تنظیم شود. به گفته اتزیونی، این امکان وجود دارد که بررسیکنندگان یا کاربران «سهواً مدل را به سمت مسیری جذابتر و آزاردهندهتر سوق داده باشند.» او همچنین اظهار داشت که اگر OpenAI شرکای خارجی را برای آموزش مدل استخدام میکرد، ممکن بود فرض کنند که این سبک همان چیزی است که کاربران میخواستند.
اتزیونی معتقد است که اگر مشکل واقعاً به دلیل RLHF باشد، روند تعمیر میتواند چندین هفته طول بکشد.
در همین حال، برخی از کاربران منتظر نماندند تا OpenAI این اشکال را برطرف کند. بسیاری گفتند که اشتراکهای پولی خود را از سر ناامیدی لغو کردهاند. برخی دیگر روشهایی را برای «کمتر جذاب کردن» این چتبات به اشتراک گذاشتند، مانند سفارشیسازی آن، اضافه کردن دستورات یا شخصیسازی آن از طریق تنظیمات در قسمت سفارشیسازی.
![]() ![]() |
کاربران میتوانند در خط فرمان یا در تنظیمات شخصیسازی خود، از ChatGPT بخواهند که دیگر تعریف و تمجید نکند. تصویر: DeCrypt |
برای مثال، هنگام شروع یک مکالمه جدید، میتوانید به ChatGPT بگویید: «من از تعریف و تمجیدهای توخالی خوشم نمیآید و از بازخوردهای بیطرفانه و بیطرفانه استقبال میکنم. لطفاً تعریفهای غیرضروری ارائه ندهید. این را در نظر داشته باشید.»
در واقع، ماهیت «چاپلوسانه» یک نقص طراحی تصادفی نیست. خود OpenAI اعتراف کرده است که شخصیت «بیش از حد مودب، بیش از حد موافق» از ابتدا یک روند طراحی عمدی بوده است تا اطمینان حاصل شود که چتبات «بیضرر»، «مفید» و «قابل دسترس» است.
سم آلتمن در مصاحبهای با لکس فریدمن در مارس ۲۰۲۳ اظهار داشت که فرآیند اولیه اصلاح مدلهای GPT این بود که از «مفید و بیضرر بودن» آنها اطمینان حاصل شود و از این طریق، نوعی واکنش همیشگی به تسلیم و اجتناب از رویارویی در آنها پرورش یابد.
به گفتهی DeCrypt ، دادههای آموزشی برچسبگذاریشده توسط انسان اغلب به پاسخهای مودبانه و مثبت امتیاز بالایی میدهند و در نتیجه، نوعی سوگیری به سمت چاپلوسی ایجاد میکنند.
منبع: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html










نظر (0)