यूट्यूब उपयोगकर्ता अनुभव को बेहतर बनाने के लिए एआई विकसित करने पर ध्यान केंद्रित कर रहा है। फोटो: डिगवॉच । |
दुनिया के सबसे बड़े ऑनलाइन वीडियो प्लेटफ़ॉर्म के रूप में, YouTube दर्शकों के लिए सबसे बड़ी बाधाओं में से एक भाषा की बाधा है। जनरेटिव AI के मज़बूत विकास के संदर्भ में, YouTube ने हाल ही में एक स्वचालित "डबिंग" सुविधा शुरू की है, जो अब वियतनामी भाषा को भी सपोर्ट करती है।
सैमसंग गैलेक्सी S25 एज के बारे में MKBHD के प्रभावशाली वीडियो में, वियतनामी भाषा में स्विच करते समय, वियतनामी आवाज़ अपेक्षाकृत आसानी से और स्पष्ट सुनाई देती है। यह अनुभव उस पेशेवर AI आवाज़ जैसा ही है जिसका इस्तेमाल आमतौर पर Google Text-to-Speech, FPT Play Voice जैसे टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में किया जाता है।
मूल अंग्रेज़ी के साथ आगे-पीछे जाने पर, डब का संपादन काफ़ी अच्छा है, और रचनाकार की बारीकियों और भावों को बखूबी बरकरार रखता है। आवाज़ में लहजे हैं, कभी-कभी "बस, बस," जैसे विस्मयादिबोधक शब्दों का इस्तेमाल होता है, जिससे ऐसा लगता है जैसे कोई सीधे आपसे बात कर रहा हो।
हालाँकि, एआई-जनरेटेड कंटेंट का अनुवाद अभी भी शब्द-दर-शब्द है, जिससे वाक्य अप्राकृतिक और अर्थ के करीब नहीं लगते। दर्शकों को रचनाकार द्वारा व्यक्त किए जा रहे अर्थ को समझने के लिए ध्यान से सुनना होगा।
हालाँकि डबिंग पूरी तरह से वियतनामी उपशीर्षकों से ली गई है, फिर भी AI "सुपर, कस्टमर, एक्सचेंज" जैसे शब्दों का सही उच्चारण नहीं कर पाता, जिससे श्रोताओं के लिए इसे समझना मुश्किल हो जाता है। इससे बोरियत, गलत संचार या मूल सामग्री की अपर्याप्तता हो सकती है।
वीडियो अपलोड करने से पहले, क्रिएटर्स AI-संचालित डबिंग सुन सकेंगे। वियतनामी सपोर्ट वाले वीडियो में आमतौर पर वियतनामी शीर्षक होंगे, जिसके ठीक नीचे "डबिंग" लिखा होगा।
विचार से लेकर वीडियो प्रदर्शन विश्लेषण, कैप्शनिंग और आवाज़ की नकल तक, हर चरण में कृत्रिम बुद्धिमत्ता मौजूद है। YouTube को उम्मीद है कि अगले पाँच सालों में, अपलोड किया गया हर वीडियो स्वचालित रूप से कई भाषाओं में डब किया जाएगा, जिसमें निर्माता की आवाज़ और भाव-भंगिमाएँ बरकरार रहेंगी।
दिसंबर 2024 के अंत तक, यह सुविधा अंग्रेजी से अनुवादित होने पर नौ भाषाओं में उपलब्ध थी। 2025 की शुरुआत में, YouTube के सीईओ नील मोहन ने आधिकारिक तौर पर पुष्टि की कि AI ऑटो डबिंग सभी भागीदारों के लिए उपलब्ध होगी। अप्रैल तक, यह सुविधा उन सभी चैनलों के लिए चुपचाप सक्षम कर दी गई, जिन्होंने मुद्रीकरण सक्षम किया था।
इस सुविधा पर असंतोष व्यक्त करने वाली एक रेडिट पोस्ट को 100 से ज़्यादा टिप्पणियाँ और 450 लाइक मिले। एक व्यक्ति ने कहा कि कई वॉइस-ओवर सॉफ़्टवेयर काफ़ी अच्छा काम कर रहे हैं, या फिर यूट्यूब में ही सबटाइटल हैं जो भाषा अनुवाद के लिए उपयोगकर्ताओं की ज़रूरतों को पूरा करते हैं।
एक अन्य टिप्पणीकार ने कहा कि एआई ने "स्पेसटाइम" शब्द को "स्पेयर टाइम" समझ लिया, जिससे अनुवाद गलत हो गया। कई अन्य उपयोगकर्ताओं ने भी शिकायत की कि यह सुविधा ठीक से काम नहीं कर रही थी और उन्होंने इसे ऐप पर अक्षम करने का प्रयास किया।
यूट्यूब खुद मानता है कि एआई ऑटो डबिंग अभी अपेक्षाकृत नई है, और वह उपयोगकर्ताओं से प्रतिक्रिया प्राप्त करना चाहता है। वीडियो पोस्ट करने से पहले, प्लेटफ़ॉर्म क्रिएटर्स को अर्थ समझने, उच्चारण करने और शोर में अंतर करने की एआई की क्षमता की सीमाओं के बारे में सूचित करेगा। दर्शकों को वीडियो वितरित करने से पहले उन्हें डबिंग की सटीकता की जाँच करनी होगी।
फिर भी, Air.io के अनुसार, यह सुविधा आज़माने लायक है। यह यह जाँचने का एक कम खर्चीला तरीका है कि क्या क्रिएटर्स को उनका कंटेंट पसंद आ रहा है और क्या वे इन डब किए गए संस्करणों के ज़रिए नए दर्शकों को आकर्षित कर पा रहे हैं। हालाँकि यह तकनीक पूरी तरह से सही नहीं है, लेकिन इसमें कंटेंट की पहुँच बढ़ाने की क्षमता है।
फ़िलहाल, सभी वीडियो में वॉइसओवर नहीं होगा और उपयोगकर्ता इस सुविधा को डिफ़ॉल्ट रूप से अक्षम नहीं कर सकते। इसके बजाय, AI वॉइसओवर संस्करण की आवृत्ति कम करने के लिए अपने ब्राउज़र की भाषा को अंग्रेज़ी में बदलने का प्रयास करें।
स्रोत: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html
टिप्पणी (0)