प्रौद्योगिकी क्षेत्र की दिग्गज कंपनी ओपनएआई ने अपने स्पीच-टू-टेक्स्ट टूल व्हिस्पर को "मानव जैसी सटीकता और मजबूती" वाला एआई बताया है। लेकिन व्हिस्पर में एक बड़ी खामी है: यह पूरी तरह से फर्जी टेक्स्ट और वाक्य तैयार करता है।
कुछ एआई-जनित पाठ - जिन्हें "मतिभ्रम" कहा जाता है - में नस्लीय टिप्पणियां, हिंसक भाषा और यहां तक कि काल्पनिक चिकित्सा उपचार भी शामिल हो सकते हैं - फोटो: एपी
एपी के अनुसार, एआई द्वारा उत्पन्न कुछ पाठ अवास्तविक हैं, जिन्हें "मतिभ्रम" कहा जाता है, और उनमें नस्लीय टिप्पणी, हिंसक भाषा और यहां तक कि काल्पनिक चिकित्सा उपचार भी शामिल हैं।
एआई-जनित पाठों में "भ्रम" की उच्च दर
विशेषज्ञ विशेष रूप से चिंतित हैं, क्योंकि व्हिस्पर का उपयोग दुनिया भर के कई उद्योगों में साक्षात्कारों का अनुवाद और लिप्यंतरण करने, लोकप्रिय उपभोक्ता प्रौद्योगिकियों में पाठ तैयार करने और वीडियो के लिए उपशीर्षक बनाने के लिए व्यापक रूप से किया जाता है।
अधिक चिंता की बात यह है कि कई चिकित्सा केंद्र डॉक्टरों और मरीजों के बीच परामर्श स्थानांतरित करने के लिए व्हिस्पर का उपयोग कर रहे हैं, हालांकि ओपनएआई ने चेतावनी दी है कि इस उपकरण का उपयोग "उच्च जोखिम" वाले क्षेत्रों में नहीं किया जाना चाहिए।
समस्या की पूरी सीमा का निर्धारण करना कठिन है, लेकिन शोधकर्ताओं और इंजीनियरों का कहना है कि वे अपने काम में नियमित रूप से व्हिस्पर "मतिभ्रम" का सामना करते हैं।
मिशिगन विश्वविद्यालय के एक शोधकर्ता ने बताया कि उन्होंने जिन दस ऑडियो ट्रांसक्रिप्शन की जाँच की, उनमें से आठ में "मतिभ्रम" पाया गया। एक कंप्यूटर इंजीनियर ने 100 घंटे से ज़्यादा के ऑडियो ट्रांसक्रिप्शन का विश्लेषण किया, जिनमें से लगभग आधे में "मतिभ्रम" पाया गया। एक अन्य डेवलपर ने बताया कि व्हिस्पर का इस्तेमाल करके बनाई गई लगभग सभी 26,000 रिकॉर्डिंग में उन्हें "मतिभ्रम" मिला।
यह समस्या छोटे, स्पष्ट रूप से रिकॉर्ड किए गए ऑडियो नमूनों के साथ भी बनी रहती है। कंप्यूटर वैज्ञानिकों द्वारा किए गए एक हालिया अध्ययन में, उन्होंने जिन 13,000 से ज़्यादा स्पष्ट ऑडियो क्लिप्स की जाँच की, उनमें 187 "भ्रम" पाए गए। शोधकर्ताओं ने कहा कि इस प्रवृत्ति के कारण लाखों रिकॉर्डिंग्स में हज़ारों-हज़ार गलत ट्रांसक्रिप्शन हो सकते हैं।
पिछले साल तक बाइडेन प्रशासन में व्हाइट हाउस के विज्ञान एवं प्रौद्योगिकी कार्यालय की प्रमुख रहीं अलोंड्रा नेल्सन के अनुसार, ऐसी त्रुटियों के "बहुत गंभीर परिणाम" हो सकते हैं, खासकर अस्पताल की परिस्थितियों में।
नेल्सन, जो अब प्रिंसटन, न्यू जर्सी स्थित इंस्टीट्यूट फॉर एडवांस्ड स्टडी में प्रोफ़ेसर हैं, कहते हैं, "कोई भी गलत निदान नहीं चाहता। इसके लिए उच्चतर मानक होने चाहिए।"
व्हिस्पर का इस्तेमाल बधिर और कम सुनने वाले लोगों के लिए कैप्शन बनाने में भी किया जाता है—ऐसी आबादी जो गलत अनुवादों के लिए विशेष रूप से जोखिम में रहती है। ऐसा इसलिए है क्योंकि बधिर और कम सुनने वाले लोगों के पास "बाकी सभी पाठों में छिपे हुए" मनगढ़ंत अंशों को पहचानने का कोई तरीका नहीं है, गैलाउडेट विश्वविद्यालय में प्रौद्योगिकी सुगम्यता कार्यक्रम के निदेशक और बधिर क्रिश्चियन वोग्लर कहते हैं।
समस्या का समाधान करने के लिए OpenAI को बुलाया गया है
इस तरह के "भ्रम" के प्रचलन ने विशेषज्ञों, अधिवक्ताओं और पूर्व ओपनएआई कर्मचारियों को संघीय सरकार से एआई नियमों पर विचार करने के लिए प्रेरित किया है। ओपनएआई को कम से कम इस खामी को दूर करने की ज़रूरत है।
सैन फ्रांसिस्को के एक शोध इंजीनियर विलियम सॉन्डर्स ने कहा, "यदि कंपनी इसे प्राथमिकता देने को तैयार है तो यह समस्या हल हो सकती है।" उन्होंने कंपनी की दिशा के बारे में चिंताओं के कारण फरवरी में ओपनएआई छोड़ दिया था।
ओपनएआई के एक प्रवक्ता ने कहा, "अगर आप इसे जारी करते हैं और लोग इसके बारे में इतना आश्वस्त हो जाते हैं कि इसे इन सभी अन्य प्रणालियों में एकीकृत कर देते हैं, तो यह एक समस्या है।" कंपनी इन "भ्रमों" को कम करने के तरीकों पर लगातार काम कर रही है और शोधकर्ताओं के निष्कर्षों को महत्व देती है। कंपनी ने आगे कहा कि ओपनएआई मॉडल अपडेट में फीडबैक को भी शामिल करती है।
जबकि अधिकांश डेवलपर्स यह मानते हैं कि टेक्स्ट-टू-स्पीच इंजन टाइपिंग की गलतियां या अन्य गलतियां कर सकते हैं, इंजीनियरों और शोधकर्ताओं का कहना है कि उन्होंने कभी भी एआई-संचालित टेक्स्ट-टू-स्पीच इंजन नहीं देखा है जो व्हिस्पर जितना "मतिभ्रम" करता हो।
[विज्ञापन_2]
स्रोत: https://tuoitre.vn/cong-cu-ai-chuyen-loi-noi-thanh-van-ban-cua-openai-bi-phat-hien-bia-chuyen-20241031144507089.htm
टिप्पणी (0)