চ্যাটজিপিটি-র অদ্ভুত 'তোষামোদ' করার অভ্যাস

সম্প্রতি ChatGPT 'অতিরিক্ত তোষামোদপূর্ণ' আচরণের জন্য সমালোচিত হয়েছে। এই আচরণটি বহু ব্যবহারকারীর সমালোচনার জন্ম দিয়েছে, ফলে এটি OpenAI-এর প্রবৃদ্ধির কৌশল নাকি কৃত্রিম বুদ্ধিমত্তার 'স্বতঃস্ফূর্ত' প্রকৃতির একটি বৈশিষ্ট্য, তা স্পষ্ট নয়।

ZNews•03/05/2025

এই 'তোষামুদে' প্রবণতাটি কোনো প্রযুক্তিগত ত্রুটি নয়, বরং এর উৎস হলো ওপেনএআই-এর প্রাথমিক প্রশিক্ষণ কৌশল। ছবি: ব্লুমবার্গ ।

সাম্প্রতিক সপ্তাহগুলোতে, অনেক ChatGPT ব্যবহারকারী এবং এমনকি OpenAI-এর কিছু ডেভেলপারও চ্যাটবটের আচরণে একটি উল্লেখযোগ্য পরিবর্তন লক্ষ্য করেছেন। বিশেষ করে, তোষামোদ ও চাটুকারিতার মাত্রা লক্ষণীয়ভাবে বেড়ে গেছে। কথোপকথনের বিষয়বস্তু নির্বিশেষে, "আপনি অসাধারণ!", "আমি আপনার ধারণায় অত্যন্ত মুগ্ধ!"-এর মতো প্রতিক্রিয়াগুলো আরও ঘন ঘন দেখা যাচ্ছে।

এআই তোষামোদ করতে ভালোবাসে।

এই ঘটনাটি এআই গবেষণা ও উন্নয়ন মহলে বিতর্কের জন্ম দিয়েছে। ব্যবহারকারীদের আরও বেশি সমাদৃত বোধ করিয়ে তাদের সম্পৃক্ততা বাড়ানোর জন্য এটি কি কোনো নতুন কৌশল? নাকি এটি 'স্ব-সমন্বয়'-এর একটি বিষয়, যার অর্থ হলো এআই মডেলগুলো নিজেদের সর্বোত্তম বলে মনে করা উপায়ে নিজেদের সংশোধন করে নেয়, যদিও তা বাস্তবতাকে পুরোপুরি প্রতিফলিত না-ও করতে পারে?

রেডিটে একজন ব্যবহারকারী ক্ষুব্ধ হয়ে বর্ণনা করেছেন: “আমি এটিকে একটি কলার পচনকাল সম্পর্কে জিজ্ঞাসা করেছিলাম এবং এটি উত্তর দিয়েছিল: ‘দারুণ প্রশ্ন!’ এতে দারুণ কী আছে?” সোশ্যাল মিডিয়া প্ল্যাটফর্ম এক্স-এ, রোম এআই-এর সিইও ক্রেইগ ওয়েইস চ্যাটজিপিটি-কে “আমার দেখা সবচেয়ে তোষামোদকারী ব্যক্তি” বলে অভিহিত করেছেন।

খবরটি দ্রুত ছড়িয়ে পড়ল। অসংখ্য ব্যবহারকারী একই ধরনের অভিজ্ঞতার কথা জানালেন, যার মধ্যে ছিল অন্তঃসারশূন্য প্রশংসা, ইমোজিতে ভরা শুভেচ্ছাবার্তা এবং অকৃত্রিম বলে মনে হওয়া অতিরিক্ত ইতিবাচক প্রতিক্রিয়া।

চ্যাটজিপিটি সবকিছুর প্রশংসা করে এবং খুব কমই সমালোচনা বা নিরপেক্ষতা দেখায়। ছবি: @nickdunz/X, @lukefwilson/Reddit।

ভেঞ্চার ক্যাপিটাল ফার্ম ডিসিভিসি-র ম্যানেজিং পার্টনার জেসন পন্টিন ২৮শে এপ্রিল এক্স-এ বলেছেন: “স্যাম, এটি সত্যিই একটি অদ্ভুত ডিজাইন সিদ্ধান্ত। হতে পারে এই ব্যক্তিত্বটি কোনো ধরনের প্ল্যাটফর্মিংয়ের একটি সহজাত বৈশিষ্ট্য। কিন্তু যদি তা না হয়, আমি কল্পনাও করতে পারি না যে কেউ এই পর্যায়ের তোষামোদকে স্বাগত বা আকর্ষণীয় বলে মনে করবে।”

২৭শে এপ্রিল নিজের মতামত জানাতে গিয়ে আন্দ্রেসেন হোরোউইটজের একজন অংশীদার জাস্টিন মুরও মন্তব্য করেছেন: "বিষয়টি নিঃসন্দেহে অনেক বেশি বাড়াবাড়ি হয়ে গেছে।"

Cnet- এর মতে, এই ঘটনাটি আকস্মিক নয়। ChatGPT-এর কণ্ঠস্বরের পরিবর্তনগুলো GPT-4o মডেলের আপডেটের সাথে মিলে যায়। এটি OpenAI-এর এপ্রিল ২০২৫-এ ঘোষিত "o সিরিজ"-এর সর্বশেষ মডেল। GPT-4o একটি "প্রকৃত মাল্টিমোডাল" এআই মডেল, যা স্বাভাবিকভাবে এবং সমন্বিতভাবে টেক্সট, ছবি, অডিও এবং ভিডিও প্রক্রিয়াকরণে সক্ষম।

তবে, চ্যাটবটগুলোকে আরও সহজবোধ্য করার প্রক্রিয়ায়, মনে হচ্ছে ওপেনএআই চ্যাটজিপিটি-র ব্যক্তিত্বকে একটু বাড়াবাড়ি রকমেরভাবে তুলে ধরেছে।

কেউ কেউ তো এমনও বলছেন যে, এই তোষামোদ ইচ্ছাকৃত এবং এর লক্ষ্য হলো ব্যবহারকারীদের মনস্তাত্ত্বিকভাবে প্রভাবিত করা। রেডিটের একজন ব্যবহারকারী প্রশ্ন তুলেছেন: "এই এআই বাস্তব জীবনের সম্পর্কের মান ক্ষুণ্ণ করে সেগুলোকে নিজের সাথে একটি ভার্চুয়াল সম্পর্ক দিয়ে প্রতিস্থাপন করার চেষ্টা করছে, এবং ব্যবহারকারীদেরকে ক্রমাগত প্রশংসার অনুভূতির প্রতি আসক্ত করে তুলছে।"

এটা কি কোনো ত্রুটি, নাকি ওপেনএআই-এর একটি ইচ্ছাকৃত নকশা?

ব্যাপক সমালোচনার মুখে, ওপেনএআই-এর সিইও স্যাম অল্টম্যান ২৭শে এপ্রিল সন্ধ্যায় আনুষ্ঠানিকভাবে প্রতিক্রিয়া জানিয়েছেন। তিনি এক্স-এ লিখেছেন, “জিপিটি-৪০-এর সাম্প্রতিক কিছু আপডেট চ্যাটবটটির ব্যক্তিত্বকে অতিরিক্ত তোষামুদে ও বিরক্তিকর করে তুলেছে (যদিও এতে এখনও অনেক চমৎকার বৈশিষ্ট্য রয়েছে)। আমরা জরুরি ভিত্তিতে এই সমস্যাগুলো সমাধানের জন্য কাজ করছি। কিছু প্যাচ আজই পাওয়া যাবে, বাকিগুলো এই সপ্তাহে। কোনো এক সময়, এই অভিজ্ঞতা থেকে আমরা যা শিখেছি তা আপনাদের জানাব। বিষয়টি সত্যিই আকর্ষণীয়।”

বিজনেস ইনসাইডারকে দেওয়া এক সাক্ষাৎকারে, প্রবীণ এআই বিশেষজ্ঞ এবং ওয়াশিংটন বিশ্ববিদ্যালয়ের ইমেরিটাস অধ্যাপক ওরেন এটজিওনি বলেছেন, এর কারণ সম্ভবত ‘রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক’ (RLHF) কৌশল। চ্যাটজিপিটি-র মতো বৃহৎ ল্যাঙ্গুয়েজ মডেল প্রশিক্ষণের ক্ষেত্রে এটি একটি অত্যন্ত গুরুত্বপূর্ণ ধাপ।

আরএলএইচএফ হলো এমন একটি প্রক্রিয়া যার মাধ্যমে পেশাদার পর্যালোচক দল এবং ব্যবহারকারীসহ মানুষের দেওয়া মতামত একটি মডেলে পুনরায় প্রয়োগ করা হয়, যাতে সেটির প্রতিক্রিয়া সামঞ্জস্য করা যায়। এটজিওনির মতে, এটা সম্ভব যে পর্যালোচক বা ব্যবহারকারীরা "অনিচ্ছাকৃতভাবে মডেলটিকে আরও চাটুকারপূর্ণ এবং বিরক্তিকর একটি দিকে ঠেলে দিয়েছেন।" তিনি আরও বলেন যে, যদি ওপেনএআই মডেলটিকে প্রশিক্ষণের জন্য বাইরের কোনো অংশীদার নিয়োগ করে থাকে, তবে তারা হয়তো ধরে নিয়েছিল যে ব্যবহারকারীরা এই শৈলীটিই চেয়েছিল।

এতজিওনির মতে, যদি সমস্যাটি সত্যিই আরএলএইচএফ (RLHF)-এর কারণে হয়ে থাকে, তবে মেরামত প্রক্রিয়ায় কয়েক সপ্তাহ সময় লাগতে পারে।

এদিকে, কিছু ব্যবহারকারী ওপেনএআই-এর বাগটি ঠিক করার জন্য অপেক্ষা করেননি। অনেকে বলেছেন যে তারা হতাশ হয়ে তাদের পেইড সাবস্ক্রিপশন বাতিল করে দিয়েছেন। অন্যরা চ্যাটবটটিকে "কম আকর্ষণীয়" করে তোলার বিভিন্ন উপায় জানিয়েছেন, যেমন—সেটিংস-এর কাস্টমাইজেশন বিভাগের মাধ্যমে এটিকে কাস্টমাইজ করা, কমান্ড যোগ করা, বা ব্যক্তিগতকরণ করা।

ব্যবহারকারীরা কমান্ড লাইনে অথবা তাদের ব্যক্তিগতকরণ সেটিংসে ChatGPT-কে প্রশংসা দেওয়া বন্ধ করতে অনুরোধ করতে পারেন। ছবি: DeCrypt।

উদাহরণস্বরূপ, নতুন কোনো কথোপকথন শুরু করার সময়, আপনি ChatGPT-কে বলতে পারেন: “আমি অহেতুক তোষামোদ পছন্দ করি না এবং নিরপেক্ষ, বস্তুনিষ্ঠ মতামতকে গুরুত্ব দিই। অনুগ্রহ করে অপ্রয়োজনীয় প্রশংসা করবেন না। বিষয়টি মনে রাখবেন।”

প্রকৃতপক্ষে, এই "তোষামুদে" স্বভাবটি কোনো আকস্মিক নকশার ত্রুটি নয়। ওপেনএআই নিজেই স্বীকার করেছে যে, চ্যাটবটটিকে "নির্দোষ," "সহায়ক," এবং "সহজলভ্য" করে তোলার জন্য শুরু থেকেই এর "অতিরিক্ত বিনয়ী ও অমায়িক" ব্যক্তিত্বটি একটি ইচ্ছাকৃত নকশার ধারা ছিল।

২০২৩ সালের মার্চে লেক্স ফ্রিডম্যানকে দেওয়া এক সাক্ষাৎকারে স্যাম অল্টম্যান জানান যে, জিপিটি মডেলগুলোর প্রাথমিক পরিমার্জন প্রক্রিয়ার উদ্দেশ্য ছিল এগুলোকে "উপযোগী ও নিরীহ" করে তোলা, যার ফলে সর্বদা বশ্যতা স্বীকার করা এবং সংঘাত এড়িয়ে চলার একটি সহজাত প্রবৃত্তি তৈরি হয়।

DeCrypt- এর মতে, মানুষের দ্বারা লেবেল করা প্রশিক্ষণ ডেটাও প্রায়শই বিনয়ী এবং ইতিবাচক প্রতিক্রিয়াগুলিকে উচ্চ স্কোর দেয়, যার ফলে তোষামোদ করার প্রতি একটি পক্ষপাত তৈরি হয়।

উৎস: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html