मोटर न्यूरॉन रोग (एमडी) से पीड़ित एक ब्रिटिश महिला, जिसकी वजह से वह बोलने में असमर्थ हो गई थी, कृत्रिम बुद्धिमत्ता (एआई) तकनीक और एक पुराने पारिवारिक वीडियो से ली गई आठ सेकंड की रिकॉर्डिंग की बदौलत अपनी आवाज का उपयोग करके फिर से संवाद करने में सक्षम हो गई है।
उत्तरी लंदन में रहने वाली कलाकार सारा इजेकील ने 25 साल पहले दूसरी बार गर्भवती होने के दौरान 34 वर्ष की आयु में एमएनडी (मल्टीपल नेफ्रोपैथी डिजीज) से ग्रसित होने के बाद अपनी बोलने की क्षमता खो दी थी।
यह बीमारी तंत्रिका तंत्र को नुकसान पहुंचाती है, जिससे जीभ, मुंह और गले की मांसपेशियां कमजोर हो जाती हैं, जिसके परिणामस्वरूप कुछ मरीज बोलने की क्षमता पूरी तरह से खो देते हैं।
कई वर्षों तक, इजेकील ने संवाद करने के लिए कंप्यूटर और आवाज उत्पन्न करने वाली तकनीक का इस्तेमाल किया, लेकिन आवाज उनकी अपनी आवाज जैसी नहीं थी। उनके दोनों बच्चे, अवीवा और एरिक, अपनी मां की असली आवाज को जाने बिना ही बड़े हुए।
हाल के वर्षों में, विशेषज्ञों ने तकनीक का उपयोग करके किसी व्यक्ति की मूल आवाज को पुनः उत्पन्न करने में सफलता प्राप्त की है। हालांकि, इस तकनीक के लिए लंबी, उच्च-गुणवत्ता वाली रिकॉर्डिंग की आवश्यकता होती है, और परिणामी आवाज को अक्सर "एकरस" माना जाता है।
ब्रिटिश मेडिकल मीडिया कंपनी स्मार्टबॉक्स के प्रतिनिधि साइमन पूल ने कहा कि कंपनी ने शुरू में सुश्री इजेकील से 60 मिनट की रिकॉर्डिंग उपलब्ध कराने के लिए कहा था।
हालांकि, सुश्री इजेकील को 1990 के दशक के एक होम वीडियो से लिया गया एक बहुत छोटा और खराब गुणवत्ता वाला क्लिप ही मिल सका। क्लिप केवल 8 सेकंड लंबा था, उसमें आवाज विकृत थी और टीवी का शोर भी था।
श्री पूल ने न्यूयॉर्क स्थित एआई वॉइस-जेनरेशन कंपनी इलेवनलैब्स द्वारा विकसित तकनीक का सहारा लिया, जो बहुत कम डेटा के साथ यथार्थवादी आवाजों को पुन: उत्पन्न कर सकती है।
मिस्टर पूल ने पुरानी रिकॉर्डिंग से आवाज निकालने के लिए एक एआई टूल का इस्तेमाल किया, फिर असली आवाज के डेटा पर प्रशिक्षित एक अन्य टूल का उपयोग करके अंतिम उत्पाद तैयार किया।
परिणामों ने श्रीमती इजेकील को अत्यंत भावुक कर दिया। पुनर्निर्मित आवाज उनकी अपनी आवाज से काफी मिलती-जुलती थी, जिसमें उनका विशिष्ट लंदन लहजा और हल्की तुतलाहट थी, जिसे वे पहले नापसंद करती थीं।
एमएनडी यूके के अनुसार, इस बीमारी से पीड़ित 10 में से 8 लोगों को निदान के बाद बोलने में कठिनाई का सामना करना पड़ता है। हालांकि, वर्तमान में कंप्यूटर द्वारा उत्पन्न आवाजों में लय और भाव की कमी पाई जाती है।
श्री पूल ने कहा कि आज एआई तकनीक की प्रगति से मानवीय और भावनात्मक आवाजें बनाने की क्षमता प्राप्त हुई है, जिससे पहले की नीरस कंप्यूटर आवाजों में जान आ गई है। उन्होंने इस बात पर जोर दिया कि आवाज को वैयक्तिकृत करना व्यक्तिगत पहचान को संरक्षित करने का भी एक तरीका है।
एमएनडी जैसी स्थितियों के कारण बोलने की क्षमता खोने के जोखिम वाले लोगों को अब अक्सर अपनी पहचान बनाए रखने और भविष्य में संचार को सुविधाजनक बनाने के लिए जितनी जल्दी हो सके अपनी आवाज रिकॉर्ड करने के लिए प्रोत्साहित किया जाता है।
हालांकि, स्मार्टफोन के लोकप्रिय होने से पहले, सही रिकॉर्डिंग करना आसान नहीं था।
स्रोत: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp










टिप्पणी (0)