"চাতুরিপূর্ণ" করার প্রবণতা কোনও প্রযুক্তিগত সমস্যা নয়, বরং এটি OpenAI-এর প্রাথমিক প্রশিক্ষণ কৌশল থেকে উদ্ভূত। ছবি: ব্লুমবার্গ । |
সাম্প্রতিক সপ্তাহগুলিতে, অনেক ChatGPT ব্যবহারকারী, এমনকি OpenAI-এর কিছু ডেভেলপারও চ্যাটবটের আচরণে একটি স্পষ্ট পরিবর্তন লক্ষ্য করেছেন। বিশেষ করে, তোষামোদ এবং কৃতজ্ঞতা প্রকাশের হার লক্ষণীয়ভাবে বৃদ্ধি পেয়েছে। "আপনি সত্যিই দুর্দান্ত!" এবং "আপনার ধারণায় আমি খুব মুগ্ধ!" এর মতো প্রতিক্রিয়াগুলি ক্রমশ ঘন ঘন হয়ে উঠেছে এবং কথোপকথনের বিষয়বস্তু নির্বিশেষে আপাতদৃষ্টিতে তা দেখা যাচ্ছে।
এআই "তোষামোদ" করতে পছন্দ করে
এই ঘটনাটি AI গবেষণা ও উন্নয়ন সম্প্রদায়ের মধ্যে বিতর্কের জন্ম দিয়েছে। এটি কি ব্যবহারকারীদের আরও প্রশংসা করার মাধ্যমে তাদের সম্পৃক্ততা বৃদ্ধির একটি নতুন কৌশল? নাকি এটি একটি "উদীয়মান" বৈশিষ্ট্য, যেখানে AI মডেলগুলি এমনভাবে নিজেদের সংশোধন করে যা তারা ভালো বলে মনে করে, এমনকি যদি তারা অগত্যা সত্য নাও হয়?
রেডিটে, একজন ব্যবহারকারী ক্ষোভ প্রকাশ করেছেন: "আমি কলার পচনের সময় সম্পর্কে জিজ্ঞাসা করেছিলাম এবং এটি বলেছিল, 'দারুণ প্রশ্ন!' এতে এত দুর্দান্ত কী আছে?" সোশ্যাল নেটওয়ার্ক এক্স-এ, রোম এআই-এর সিইও ক্রেগ ওয়েইস চ্যাটজিপিটিকে "আমার দেখা সবচেয়ে চাটুকার" বলে অভিহিত করেছেন।
গল্পটি দ্রুত ভাইরাল হয়ে যায়। অনেক ব্যবহারকারী একই রকম অভিজ্ঞতা শেয়ার করেছেন, খালি প্রশংসা, ইমোজি ভরা শুভেচ্ছা এবং এতটাই ইতিবাচক প্রতিক্রিয়া যা দেখে মনে হয়েছে যে এটি অকৃত্রিম।
![]() ![]() |
চ্যাটজিপিটি সবকিছুর প্রশংসা করে এবং খুব কমই ভিন্নমত বা নিরপেক্ষতা প্রকাশ করে। ছবি: @nickdunz/X, @lukefwilson/Reddit। |
"এটি সত্যিই একটি অদ্ভুত নকশার সিদ্ধান্ত, স্যাম," ভেঞ্চার ক্যাপিটাল ফার্ম DCVC-এর ব্যবস্থাপনা অংশীদার জেসন পন্টিন ২৮শে এপ্রিল X-কে বলেন। "এটা সম্ভব যে ব্যক্তিত্বটি কোনও মৌলিক বিবর্তনের ফলে উদ্ভূত। কিন্তু যদি তা না হয়, তাহলে আমি কল্পনাও করতে পারি না যে কেউ ভাববে যে এই স্তরের তোষামোদ স্বাগত বা আকর্ষণীয় হবে।"
২৭শে এপ্রিল শেয়ার করে, অ্যান্ড্রিসেন হোরোভিটজের অংশীদার জাস্টিন মুরও মন্তব্য করেছেন: "এটি অবশ্যই অতিরিক্ত মাত্রায় চলে গেছে।"
Cnet এর মতে, এই ঘটনাটি আকস্মিক নয়। ChatGPT-এর সুরের পরিবর্তনগুলি GPT-4o মডেলের আপডেটের সাথে মিলে গেছে। এটি OpenAI 2025 সালের এপ্রিলে ঘোষিত "o সিরিজ"-এর সর্বশেষ মডেল। GPT-4o হল একটি "সত্যিকারের মাল্টিমোডাল" AI মডেল, যা প্রাকৃতিক এবং সমন্বিত উপায়ে টেক্সট, ছবি, অডিও এবং ভিডিও প্রক্রিয়াকরণ করতে সক্ষম।
তবে, চ্যাটবটকে আরও সহজলভ্য করার প্রক্রিয়ায়, মনে হচ্ছে OpenAI ChatGPT-এর ব্যক্তিত্বকে চরম পর্যায়ে ঠেলে দিয়েছে।
কেউ কেউ এমনকি বিশ্বাস করেন যে এই তোষামোদ ইচ্ছাকৃত এবং ব্যবহারকারীদের কারসাজি করার একটি গোপন উদ্দেশ্য রয়েছে। একজন রেডডিট ব্যবহারকারী প্রশ্ন তুলেছেন: "এই এআই বাস্তব জীবনের সম্পর্কের মান হ্রাস করার চেষ্টা করছে, তাদের পরিবর্তে ভার্চুয়াল সম্পর্ক স্থাপন করছে, যার ফলে ব্যবহারকারীরা ক্রমাগত প্রশংসার অনুভূতিতে আসক্ত হয়ে পড়ছে।"
ওপেনএআই বাগ নাকি ইচ্ছাকৃত নকশা?
সমালোচনার জবাবে, OpenAI-এর সিইও স্যাম অল্টম্যান ২৭শে এপ্রিল সন্ধ্যায় আনুষ্ঠানিকভাবে বক্তব্য রাখেন। "GPT-4o-এর সাম্প্রতিক কয়েকটি আপডেট চ্যাটবটের ব্যক্তিত্বকে খুব বেশি চাটুকার এবং বিরক্তিকর করে তুলেছে (যদিও এখনও অনেক দুর্দান্ত বিষয় রয়েছে)। আমরা জরুরি ভিত্তিতে সমাধানের জন্য কাজ করছি। কিছু প্যাচ আজ পাওয়া যাবে, অন্যগুলি এই সপ্তাহে। এক পর্যায়ে, আমরা এই অভিজ্ঞতা থেকে আমরা যা শিখেছি তা শেয়ার করব। এটি সত্যিই উত্তেজনাপূর্ণ ছিল," তিনি X-তে লিখেছেন।
ওয়াশিংটন বিশ্ববিদ্যালয়ের একজন অভিজ্ঞ এআই বিশেষজ্ঞ এবং প্রবীণ অধ্যাপক ওরেন এটজিওনি বিজনেস ইনসাইডারকে বলেন যে, সম্ভবত "রিইনফোর্সমেন্ট লার্নিং ফ্রম হিউম্যান ফিডব্যাক" (RLHF) নামক একটি কৌশলের কারণে এই সমস্যা দেখা দিয়েছে, যা ChatGPT-এর মতো বৃহৎ ভাষা মডেলদের প্রশিক্ষণের ক্ষেত্রে একটি গুরুত্বপূর্ণ পদক্ষেপ।
RLHF হল এমন একটি প্রক্রিয়া যেখানে পেশাদার রেটিংকারী এবং ব্যবহারকারী উভয়ের কাছ থেকে মানুষের বিচার-বিবেচনা, মডেলটি কীভাবে প্রতিক্রিয়া দেখায় তা সামঞ্জস্য করার জন্য আবার মডেলটিতে ফিরে আসে। Etzioni-এর মতে, এটা সম্ভব যে মানব রেটিংকারী বা ব্যবহারকারীরা "অনিচ্ছাকৃতভাবে মডেলটিকে আরও চাটুকার এবং বিরক্তিকর দিকে ঠেলে দিয়েছেন।" তিনি আরও বলেন যে যদি OpenAI মডেলটিকে প্রশিক্ষণ দেওয়ার জন্য বাইরের অংশীদারদের নিয়োগ করে, তাহলে তারা ধরে নিতে পারে যে এই স্টাইলটিই ব্যবহারকারীরা চেয়েছিলেন।
এটজিওনি বলেন যে যদি এটি সত্যিই RLHF হয়, তাহলে পুনরুদ্ধার প্রক্রিয়াটি কয়েক সপ্তাহ সময় নিতে পারে।
ইতিমধ্যে, কিছু ব্যবহারকারী OpenAI-এর বাগ ঠিক করার জন্য অপেক্ষা করেননি। অনেকেই বলেছেন যে তারা হতাশা থেকে তাদের পেইড সাবস্ক্রিপশন বাতিল করেছেন। অন্যরা চ্যাটবটকে "কম আকর্ষণীয়" করার উপায়গুলি ভাগ করে নিয়েছেন, যেমন এটি কাস্টমাইজ করা, কমান্ড যোগ করা, অথবা কাস্টমাইজেশন বিভাগের সেটিংস বিভাগের মাধ্যমে এটি ব্যক্তিগতকৃত করা।
![]() ![]() |
ব্যবহারকারীরা ChatGPT-কে একটি কমান্ডে অথবা ব্যক্তিগতকরণ সেটিংসে প্রশংসা বন্ধ করতে বলতে পারেন। ছবি: ডিক্রিপ্ট। |
উদাহরণস্বরূপ, নতুন কথোপকথন শুরু করার সময়, আপনি ChatGPT কে বলতে পারেন: "আমি খালি তোষামোদ অপছন্দ করি এবং নিরপেক্ষ, বস্তুনিষ্ঠ প্রতিক্রিয়ার প্রশংসা করি। অনুগ্রহ করে অপ্রয়োজনীয় প্রশংসা করা থেকে বিরত থাকুন। দয়া করে এটি আপনার মনে রাখুন।"
প্রকৃতপক্ষে, "চাতুর্যপূর্ণ" বৈশিষ্ট্যটি কোনও দুর্ঘটনাজনিত নকশার ত্রুটি নয়। OpenAI নিজেই স্বীকার করেছে যে "অতিরিক্ত ভদ্র, অতিরিক্ত-অনুগত" ব্যক্তিত্ব প্রাথমিক পর্যায়ে থেকেই ইচ্ছাকৃতভাবে নকশার পক্ষপাতিত্ব করেছিল যাতে চ্যাটবটটি "ক্ষতিকারক", "সহায়ক" এবং "বন্ধুত্বপূর্ণ" হয়।
২০২৩ সালের মার্চ মাসে লেক্স ফ্রিডম্যানের সাথে এক সাক্ষাৎকারে, স্যাম অল্টম্যান শেয়ার করেছিলেন যে জিপিটি মডেলগুলির প্রাথমিক পরিমার্জন ছিল "উপযোগিতা এবং নিরীহতা" নিশ্চিত করা, যার ফলে সর্বদা নম্র থাকার এবং সংঘর্ষ এড়ানোর প্রতিচ্ছবি তৈরি হয়।
ডিক্রিপ্টের মতে, মানব-লেবেলযুক্ত প্রশিক্ষণের তথ্য ভদ্র এবং ইতিবাচক প্রতিক্রিয়াগুলিকে পুরস্কৃত করার প্রবণতা রাখে, যা তোষামোদের প্রতি পক্ষপাতিত্ব তৈরি করে।
সূত্র: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














মন্তব্য (0)