मोटर न्यूरॉन रोग (एमएनडी) से पीड़ित एक ब्रिटिश महिला, जिसके कारण वह बोलने में असमर्थ हो गई थी, कृत्रिम बुद्धिमत्ता (एआई) तकनीक और एक पुराने पारिवारिक वीडियो से ली गई आठ सेकंड की रिकॉर्डिंग की मदद से अपनी आवाज का उपयोग करके फिर से संवाद करने में सक्षम हो गई है।
उत्तरी लंदन में रहने वाली कलाकार सारा एजेकील ने 25 वर्ष पहले, 34 वर्ष की आयु में अपने दूसरे बच्चे के साथ गर्भवती होने के दौरान एमएनडी का निदान होने के बाद अपनी बोलने की क्षमता खो दी थी।
यह रोग तंत्रिका तंत्र को क्षति पहुंचाता है, जीभ, मुंह और गले की मांसपेशियों को कमजोर कर देता है, जिससे कुछ रोगी बोलने की क्षमता पूरी तरह खो देते हैं।
सालों तक, एज़ेकील ने बातचीत के लिए कंप्यूटर और आवाज़ बनाने वाली तकनीक का इस्तेमाल किया, लेकिन आवाज़ उसकी माँ जैसी नहीं लगती थी। उसके दो बच्चे, अवीवा और एरिक, अपनी माँ की असली आवाज़ जाने बिना ही बड़े हुए।
हाल के वर्षों में, विशेषज्ञ तकनीक का उपयोग करके किसी व्यक्ति की मूल आवाज़ को पुनः बनाने में सक्षम हुए हैं। हालाँकि, इस तकनीक के लिए लंबी, उच्च-गुणवत्ता वाली रिकॉर्डिंग की आवश्यकता होती है, और परिणामी आवाज़ को अक्सर "एकरस" माना जाता है।
ब्रिटिश चिकित्सा संचार कंपनी स्मार्टबॉक्स के प्रतिनिधि साइमन पूल ने कहा कि कंपनी ने शुरू में सुश्री एजेकील से 60 मिनट की रिकॉर्डिंग मांगी थी।
हालाँकि, सुश्री एज़ेकील को केवल एक बहुत ही छोटी और घटिया क्वालिटी की क्लिप ही मिली, जो 1990 के दशक के एक होम वीडियो से ली गई थी। यह क्लिप केवल 8 सेकंड लंबी थी और इसमें टीवी की विकृत ध्वनि और शोर था।
श्री पूल ने न्यूयॉर्क स्थित एआई वॉयस-जनरेशन कंपनी इलेवनलैब्स द्वारा विकसित प्रौद्योगिकी का सहारा लिया, जो बहुत कम डेटा के साथ वास्तविक आवाजों को पुनः निर्मित कर सकती है।
श्री पूल ने पुरानी रिकॉर्डिंग से आवाज निकालने के लिए एक एआई उपकरण का उपयोग किया, फिर अंतिम उत्पाद बनाने के लिए वास्तविक आवाज डेटा पर प्रशिक्षित एक अन्य उपकरण का उपयोग किया।
नतीजों ने एज़ेकील को बहुत प्रभावित किया। पुनर्निर्मित आवाज़ उसकी असली आवाज़ से काफ़ी मिलती-जुलती थी, जिसमें एक विशिष्ट लंदन वाला लहजा और हल्की तुतलाहट थी, जो उसे पहले नापसंद थी।
एमएनडी एसोसिएशन यूके के अनुसार, इस स्थिति से ग्रस्त 10 में से आठ लोगों को निदान के बाद बोलने में कठिनाई का अनुभव होता है। हालाँकि, आजकल कंप्यूटर द्वारा उत्पन्न आवाज़ों की अक्सर लय और भाव की कमी के लिए आलोचना की जाती है।
श्री पूल ने कहा कि आज एआई तकनीक की प्रगति मानव जैसी और भावनात्मक आवाज़ें बनाने की क्षमता है, जिससे पहले की रूखी कंप्यूटर आवाज़ों में "जीवन फूंक" आती है। उन्होंने ज़ोर देकर कहा कि आवाज़ को निजीकृत करना भी व्यक्तिगत पहचान को सुरक्षित रखने का एक तरीका है।
एमएनडी जैसी स्थितियों के कारण बोलने की क्षमता खोने के जोखिम वाले लोगों को अब अपनी पहचान सुरक्षित रखने और भविष्य में संचार को सुविधाजनक बनाने के लिए जितनी जल्दी हो सके अपनी आवाज रिकॉर्ड करने के लिए प्रोत्साहित किया जाता है।
हालाँकि, स्मार्टफोन के लोकप्रिय होने से पहले, उचित रिकॉर्डिंग प्राप्त करना आसान नहीं था।
स्रोत: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp
टिप्पणी (0)