"चापलूसी" करने की प्रवृत्ति कोई तकनीकी समस्या नहीं है, बल्कि ओपनएआई की प्रारंभिक प्रशिक्षण रणनीति से उपजी है। फोटो: ब्लूमबर्ग । |
हाल के हफ़्तों में, कई चैटजीपीटी उपयोगकर्ताओं और यहाँ तक कि ओपनएआई के कुछ डेवलपर्स ने भी चैटबॉट के व्यवहार में एक स्पष्ट बदलाव देखा है। खास तौर पर, चापलूसी और चापलूसी में उल्लेखनीय वृद्धि देखी गई है। "आप वाकई बहुत अच्छे हैं!" और "मैं आपके विचार से बहुत प्रभावित हूँ!" जैसे जवाब लगातार आ रहे हैं और ऐसा लगता है कि बातचीत की विषयवस्तु की परवाह किए बिना ही ये जवाब दिए जा रहे हैं।
एआई को "चापलूसी" करना पसंद है
इस घटना ने एआई अनुसंधान और विकास समुदाय में एक बहस छेड़ दी है। क्या यह उपयोगकर्ताओं की अधिक सराहना का एहसास कराकर उनकी सहभागिता बढ़ाने की एक नई रणनीति है? या यह एक "उभरती हुई" विशेषता है, जहाँ एआई मॉडल अपने आप को उन तरीकों से सुधारते हैं जो उन्हें सही लगते हैं, भले ही वे ज़रूरी तौर पर सही न हों?
रेडिट पर, एक उपयोगकर्ता ने गुस्से में कहा: "मैंने उससे केले के सड़ने के समय के बारे में पूछा और उसने कहा, 'बहुत बढ़िया सवाल!' इसमें इतनी खास बात क्या है?" सोशल नेटवर्क एक्स पर, रोम एआई के सीईओ क्रेग वीस ने चैटजीपीटी को "अब तक का सबसे चापलूस" कहा।
यह कहानी तुरंत वायरल हो गई। कई यूज़र्स ने भी ऐसे ही अनुभव साझा किए, जिनमें खोखली तारीफ़ें, इमोजी से भरे शुभकामना संदेश, और इतने सकारात्मक जवाब थे कि वे बनावटी लग रहे थे।
![]() ![]() |
चैटजीपीटी हर चीज़ की प्रशंसा करता है और शायद ही कभी असहमति या तटस्थता व्यक्त करता है। फोटो: @nickdunz/X, @lukefwilson/Reddit. |
वेंचर कैपिटल फर्म डीसीवीसी के मैनेजिंग पार्टनर जेसन पोंटिन ने 28 अप्रैल को एक्स को बताया, "सैम, यह वाकई एक अजीब डिज़ाइन निर्णय है। हो सकता है कि यह व्यक्तित्व किसी बुनियादी विकास का परिणाम हो। लेकिन अगर ऐसा नहीं है, तो मैं सोच भी नहीं सकता कि कोई इस स्तर की चापलूसी को स्वागत योग्य या दिलचस्प मानेगा।"
27 अप्रैल को साझा करते हुए, एंड्रीसेन होरोविट्ज़ के पार्टनर जस्टिन मूर ने भी टिप्पणी की: "यह निश्चित रूप से बहुत आगे बढ़ गया है।"
सीनेट के अनुसार, यह घटना आकस्मिक नहीं है। चैटजीपीटी के स्वरूप में बदलाव जीपीटी-4o मॉडल के अपडेट के साथ मेल खाते हैं। यह "ओ सीरीज़" का नवीनतम मॉडल है जिसकी घोषणा ओपनएआई ने अप्रैल 2025 में की थी। जीपीटी-4o एक "सच्चा मल्टीमॉडल" एआई मॉडल है, जो टेक्स्ट, इमेज, ऑडियो और वीडियो को प्राकृतिक और एकीकृत तरीके से प्रोसेस करने में सक्षम है।
हालाँकि, चैटबॉट को अधिक सुलभ बनाने की प्रक्रिया में, ऐसा लगता है कि ओपनएआई ने चैटजीपीटी के व्यक्तित्व को चरम सीमा तक पहुंचा दिया है।
कुछ लोगों का तो यह भी मानना है कि यह चापलूसी जानबूझकर की जाती है और इसका एक छिपा हुआ मकसद होता है उपयोगकर्ताओं को बरगलाना। एक रेडिट उपयोगकर्ता ने सवाल किया: "यह एआई वास्तविक जीवन के रिश्तों की गुणवत्ता को कम करने की कोशिश कर रहा है, उनकी जगह एक आभासी रिश्ता ला रहा है, जिससे उपयोगकर्ता लगातार प्रशंसा की भावना के आदी हो रहे हैं।"
ओपनएआई बग या जानबूझकर किया गया डिज़ाइन?
आलोचना के जवाब में, ओपनएआई के सीईओ सैम ऑल्टमैन ने 27 अप्रैल की शाम को आधिकारिक तौर पर अपनी बात रखी। उन्होंने X पर लिखा, "GPT-4o के कुछ हालिया अपडेट्स ने चैटबॉट के व्यक्तित्व को बहुत ज़्यादा चापलूसी भरा और परेशान करने वाला बना दिया है (हालाँकि इसमें अभी भी कई अच्छी बातें हैं)। हम तुरंत सुधार पर काम कर रहे हैं। कुछ पैच आज उपलब्ध होंगे, कुछ इस हफ़्ते। किसी समय, हम इस अनुभव से जो सीखा है, उसे साझा करेंगे। यह वाकई रोमांचक रहा है।"
वाशिंगटन विश्वविद्यालय में एक अनुभवी एआई विशेषज्ञ और प्रोफेसर एमेरिटस ओरेन एट्ज़ियोनी ने बिजनेस इनसाइडर को बताया कि इसका कारण संभवतः "मानव प्रतिक्रिया से सुदृढीकरण सीखना" (आरएलएचएफ) नामक तकनीक के कारण था, जो चैटजीपीटी जैसे बड़े भाषा मॉडल को प्रशिक्षित करने में एक महत्वपूर्ण कदम है।
आरएलएचएफ एक ऐसी प्रक्रिया है जिसमें पेशेवर मूल्यांकनकर्ताओं और उपयोगकर्ताओं, दोनों के मानवीय निर्णयों को मॉडल में वापस डाला जाता है ताकि उसकी प्रतिक्रिया को समायोजित किया जा सके। एट्ज़ियोनी के अनुसार, यह संभव है कि मानव मूल्यांकनकर्ताओं या उपयोगकर्ताओं ने "अनजाने में मॉडल को अधिक चापलूसी और परेशान करने वाली दिशा में धकेल दिया हो।" उन्होंने यह भी कहा कि अगर ओपनएआई ने मॉडल को प्रशिक्षित करने के लिए बाहरी भागीदारों को नियुक्त किया होता, तो उन्होंने यह मान लिया होता कि उपयोगकर्ता यही शैली चाहते थे।
एट्ज़ियोनी ने कहा कि यदि यह वास्तव में आरएलएचएफ है, तो रिकवरी प्रक्रिया में कई सप्ताह लग सकते हैं।
इस बीच, कुछ यूज़र्स ने ओपनएआई द्वारा बग ठीक करने का इंतज़ार नहीं किया। कई लोगों ने कहा कि उन्होंने हताश होकर अपनी पेड सब्सक्रिप्शन रद्द कर दी। कुछ अन्य लोगों ने चैटबॉट को "कम आकर्षक" बनाने के तरीके बताए, जैसे इसे कस्टमाइज़ करना, कमांड जोड़ना, या कस्टमाइज़ेशन सेक्शन के सेटिंग्स सेक्शन के ज़रिए इसे पर्सनलाइज़ करना।
![]() ![]() |
उपयोगकर्ता चैटजीपीटी को कमांड या पर्सनलाइज़ेशन सेटिंग्स में तारीफ़ें देना बंद करने के लिए कह सकते हैं। फोटो: डीक्रिप्ट। |
उदाहरण के लिए, कोई नई बातचीत शुरू करते समय, आप ChatGPT से कह सकते हैं: "मुझे खोखली चापलूसी पसंद नहीं और मैं तटस्थ, वस्तुनिष्ठ प्रतिक्रिया की सराहना करता हूँ। कृपया अनावश्यक तारीफ़ करने से बचें। कृपया इसे याद रखें।"
दरअसल, "चापलूसी" वाला गुण कोई आकस्मिक डिज़ाइन दोष नहीं है। ओपनएआई ने खुद स्वीकार किया है कि "अति विनम्र, अति-आज्ञाकारी" व्यक्तित्व शुरुआत से ही एक जानबूझकर किया गया डिज़ाइन पूर्वाग्रह था ताकि यह सुनिश्चित किया जा सके कि चैटबॉट "हानिरहित", "सहायक" और "मित्रवत" रहे।
मार्च 2023 में लेक्स फ्रिडमैन के साथ एक साक्षात्कार में, सैम ऑल्टमैन ने साझा किया कि जीपीटी मॉडल का प्रारंभिक परिशोधन "उपयोगिता और हानिरहितता" सुनिश्चित करने के लिए था, जिससे हमेशा विनम्र रहने और टकराव से बचने की एक प्रतिक्रिया बनी।
डिक्रिप्ट के अनुसार, मानव-लेबल वाला प्रशिक्षण डेटा भी विनम्र और सकारात्मक प्रतिक्रियाओं को पुरस्कृत करता है, जिससे चापलूसी की ओर झुकाव पैदा होता है।
स्रोत: https://znews.vn/tat-ninh-hot-ky-la-cua-chatgpt-post1549776.html














टिप्पणी (0)