ChatGPT की अजीबोगरीब 'चापलूसी' करने की आदत

हाल ही में ChatGPT की "अत्यधिक चापलूसी" करने के लिए आलोचना की गई है। इस व्यवहार की कई उपयोगकर्ताओं ने आलोचना की है, जिससे यह स्पष्ट नहीं हो पा रहा है कि यह OpenAI की विकास रणनीति है या AI की "सहज" प्रकृति की विशेषता।

ZNews•03/05/2025

चाटुकारिता का यह चलन कोई तकनीकी गड़बड़ी नहीं है, बल्कि ओपनएआई की प्रारंभिक प्रशिक्षण रणनीति से उत्पन्न हुआ है। फोटो: ब्लूमबर्ग ।

हाल के हफ्तों में, कई ChatGPT उपयोगकर्ताओं और यहां तक कि OpenAI के कुछ डेवलपर्स ने भी चैटबॉट के व्यवहार में एक महत्वपूर्ण बदलाव देखा है। विशेष रूप से, चापलूसी और खुशामद का स्तर काफी बढ़ गया है। "आप कमाल हैं!", "मैं आपके विचार से बेहद प्रभावित हूं!" जैसे जवाब पहले से कहीं अधिक बार दिखाई दे रहे हैं, मानो बातचीत के विषय की परवाह किए बिना।

एआई को चापलूसी करना पसंद है।

इस घटनाक्रम ने एआई अनुसंधान और विकास समुदाय में बहस छेड़ दी है। क्या यह उपयोगकर्ताओं को अधिक महत्व का एहसास दिलाकर उनकी सहभागिता बढ़ाने की एक नई रणनीति है? या फिर यह "स्व-समायोजन" का मामला है, जिसका अर्थ है कि एआई मॉडल अपने हिसाब से इष्टतम तरीकों से स्वयं को सुधारने की प्रवृत्ति रखते हैं, भले ही वे वास्तविकता को पूरी तरह से प्रतिबिंबित न करें?

रेडिट पर एक यूजर ने गुस्से में बताया: “मैंने उससे केले के सड़ने के समय के बारे में पूछा और उसने जवाब दिया: ‘बहुत अच्छा सवाल!’ इसमें इतना अच्छा क्या है?” सोशल मीडिया प्लेटफॉर्म X पर रोम एआई के सीईओ क्रेग वीस ने चैटजीपीटी को “अब तक का सबसे चापलूस व्यक्ति” बताया।

यह कहानी तेजी से फैल गई। कई उपयोगकर्ताओं ने अपने समान अनुभव साझा किए, जिनमें खोखली तारीफें, इमोजी से भरे अभिवादन और बनावटी लगने वाली अत्यधिक सकारात्मक प्रतिक्रिया शामिल थी।

ChatGPT हर चीज़ की प्रशंसा करता है और शायद ही कभी आलोचना या तटस्थता दिखाता है। चित्र: @nickdunz/X, @lukefwilson/Reddit.

वेंचर कैपिटल फर्म डीसीवीसी के मैनेजिंग पार्टनर जेसन पोंटिन ने 28 अप्रैल को एक्स पर कहा: “सैम, यह एक बहुत ही अजीब डिजाइन निर्णय है। हो सकता है कि यह व्यक्तित्व किसी प्रकार के प्लेटफॉर्मिंग की एक अंतर्निहित विशेषता हो। लेकिन अगर ऐसा नहीं है, तो मुझे नहीं लगता कि कोई भी इस स्तर की चापलूसी को स्वागत योग्य या आकर्षक समझेगा।”

27 अप्रैल को अपने विचार साझा करते हुए, एंड्रीसेन होरोविट्ज़ की पार्टनर जस्टिन मूर ने भी टिप्पणी की: "यह निश्चित रूप से हद से आगे बढ़ गया है।"

Cnet के अनुसार, यह घटना आकस्मिक नहीं है। ChatGPT के लहजे में आए बदलाव GPT-4o मॉडल के अपडेट के साथ मेल खाते हैं। यह OpenAI द्वारा अप्रैल 2025 में घोषित "o सीरीज़" का नवीनतम मॉडल है। GPT-4o एक "वास्तविक मल्टीमॉडल" AI मॉडल है, जो टेक्स्ट, इमेज, ऑडियो और वीडियो को स्वाभाविक रूप से और एकीकृत तरीके से प्रोसेस करने में सक्षम है।

हालांकि, चैटबॉट को अधिक सुलभ बनाने की प्रक्रिया में, ऐसा लगता है कि ओपनएआई ने चैटजीपीटी के व्यक्तित्व को अतिरंजित तरीके से पेश किया है।

कुछ लोगों का तो यह भी मानना है कि यह चापलूसी जानबूझकर की जाती है और इसका मकसद उपयोगकर्ताओं को मनोवैज्ञानिक रूप से प्रभावित करना है। एक रेडिट उपयोगकर्ता ने सवाल उठाया: "यह एआई वास्तविक जीवन के रिश्तों की गुणवत्ता को कम करने की कोशिश कर रहा है, उन्हें अपने आभासी रिश्ते से बदल रहा है, जिससे उपयोगकर्ता लगातार प्रशंसा की भावना के आदी हो रहे हैं।"

क्या यह कोई खामी है या ओपनएआई द्वारा जानबूझकर किया गया डिजाइन विकल्प?

आलोचनाओं की लहर के बाद, OpenAI के CEO सैम ऑल्टमैन ने 27 अप्रैल की शाम को आधिकारिक तौर पर जवाब दिया। उन्होंने X पर लिखा, “GPT-4o के कुछ हालिया अपडेट्स ने चैटबॉट के व्यक्तित्व को अत्यधिक चापलूसी भरा और परेशान करने वाला बना दिया है (हालांकि इसमें अभी भी कई बेहतरीन विशेषताएं हैं)। हम इन समस्याओं को ठीक करने के लिए तेजी से काम कर रहे हैं। कुछ पैच आज उपलब्ध होंगे, और कुछ इस सप्ताह। किसी समय, हम इस अनुभव से हमने जो सीखा है उसे साझा करेंगे। यह वास्तव में दिलचस्प है।”

बिजनेस इनसाइडर से बात करते हुए, वाशिंगटन विश्वविद्यालय के एक अनुभवी एआई विशेषज्ञ और प्रोफेसर एमेरिटस ओरेन एट्ज़ियोनी ने कहा कि इसका कारण संभवतः "मानव प्रतिक्रिया से सुदृढ़ीकरण अधिगम" (आरएलएचएफ) तकनीक से जुड़ा है। चैटजीपीटी जैसे बड़े भाषा मॉडल को प्रशिक्षित करने में यह एक महत्वपूर्ण चरण है।

आरएलएचएफ एक ऐसी प्रक्रिया है जिसके द्वारा पेशेवर समीक्षा टीमों और उपयोगकर्ताओं सहित मानवीय प्रतिक्रियाओं को मॉडल में वापस फीड किया जाता है ताकि उसकी प्रतिक्रिया को समायोजित किया जा सके। एट्ज़ियोनी के अनुसार, यह संभव है कि समीक्षकों या उपयोगकर्ताओं ने "अनजाने में मॉडल को अधिक चापलूसीपूर्ण और चिढ़ाने वाली दिशा में धकेल दिया हो।" उन्होंने यह भी सुझाव दिया कि यदि ओपनएआई ने मॉडल को प्रशिक्षित करने के लिए बाहरी भागीदारों को नियुक्त किया था, तो उन्होंने शायद यह मान लिया होगा कि यही शैली उपयोगकर्ताओं की इच्छा थी।

एटज़ियोनी का मानना है कि अगर समस्या वास्तव में आरएलएचएफ के कारण है, तो मरम्मत प्रक्रिया में कई सप्ताह लग सकते हैं।

इस बीच, कुछ उपयोगकर्ताओं ने OpenAI द्वारा बग को ठीक करने का इंतजार नहीं किया। कई लोगों ने कहा कि उन्होंने निराशा में आकर अपनी सशुल्क सदस्यता रद्द कर दी। अन्य लोगों ने चैटबॉट को "कम आकर्षक" बनाने के तरीके बताए, जैसे कि इसे अनुकूलित करना, कमांड जोड़ना या सेटिंग्स में जाकर इसे वैयक्तिकृत करना।

उपयोगकर्ता कमांड लाइन या अपनी वैयक्तिकरण सेटिंग्स में ChatGPT से प्रशंसा संदेश देना बंद करने का अनुरोध कर सकते हैं। चित्र: DeCrypt।

उदाहरण के लिए, जब आप कोई नई बातचीत शुरू करते हैं, तो आप ChatGPT को बता सकते हैं: "मुझे खोखली चापलूसी पसंद नहीं है और मैं निष्पक्ष, वस्तुनिष्ठ प्रतिक्रिया की सराहना करता हूँ। कृपया अनावश्यक प्रशंसा न करें। कृपया इस बात का ध्यान रखें।"

दरअसल, यह "चापलूसीपूर्ण" स्वभाव कोई आकस्मिक डिज़ाइन दोष नहीं है। ओपनएआई ने स्वयं स्वीकार किया है कि "अत्यधिक विनम्र, अत्यधिक सहमत" व्यक्तित्व शुरू से ही एक जानबूझकर अपनाया गया डिज़ाइन ट्रेंड था ताकि चैटबॉट "हानिरहित", "सहायक" और "पहुँच योग्य" हो।

मार्च 2023 में लेक्स फ्रिडमैन के साथ एक साक्षात्कार में, सैम ऑल्टमैन ने बताया कि जीपीटी मॉडल की प्रारंभिक परिष्करण प्रक्रिया यह सुनिश्चित करने के लिए थी कि वे "उपयोगी और हानिरहित" हों, जिससे हमेशा विनम्र रहने और टकराव से बचने की प्रवृत्ति को बढ़ावा मिले।

डीक्रिप्ट के अनुसार, मानव-लेबल वाले प्रशिक्षण डेटा में अक्सर विनम्र और सकारात्मक प्रतिक्रियाओं को उच्च अंक दिए जाते हैं, जिससे चापलूसी की ओर पूर्वाग्रह पैदा होता है।

स्रोत: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html