यूट्यूब उपयोगकर्ता अनुभव को बेहतर बनाने के लिए एआई विकसित करने पर ध्यान केंद्रित कर रहा है। फोटो: डिजीवॉच । |
दुनिया के सबसे बड़े ऑनलाइन वीडियो प्लेटफॉर्म के रूप में, YouTube दर्शकों के लिए सबसे बड़ी सीमाओं में से एक भाषा की बाधा है। कृत्रिम बुद्धिमत्ता (AI) द्वारा निर्मित सामग्री के तीव्र विकास के बीच, YouTube ने हाल ही में स्वचालित वॉइसओवर सुविधा शुरू की है, जो अब वियतनामी भाषा का समर्थन करती है।
सैमसंग गैलेक्सी S25 एज के बारे में MKBHD के प्रभावशाली वीडियो में, जब भाषा को वियतनामी में बदला जाता है, तो वियतनामी आवाज अपेक्षाकृत आसानी से समझ में आती है और स्पष्ट सुनाई देती है। यह अनुभव गूगल टेक्स्ट-टू-स्पीच और FPT प्ले वॉयस जैसे टेक्स्ट-टू-स्पीच सॉफ़्टवेयर में आमतौर पर इस्तेमाल होने वाली पेशेवर AI वॉइस रीडिंग के काफी समान है।
मूल अंग्रेज़ी संस्करण और डब किए गए संस्करण के बीच तुलना करने पर, डब किया गया संस्करण काफी सटीक है, जो रचनाकार की बारीकियों और भावों को बखूबी बरकरार रखता है। आवाज़ में लय है, कभी-कभी "हाँ, यही है" जैसे विस्मयादिबोधक शब्दों का प्रयोग किया गया है, जिससे लगभग प्रत्यक्ष संवाद का आभास होता है।
हालांकि, कृत्रिम बुद्धिमत्ता द्वारा किए गए अनुवाद अक्सर यांत्रिक और शब्द-दर-शब्द होते हैं, जिसके परिणामस्वरूप वाक्य अस्वाभाविक और गलत हो जाते हैं। दर्शकों को रचनाकार के इच्छित अर्थ को समझने के लिए ध्यानपूर्वक सुनना चाहिए।
हालांकि वॉइसओवर पूरी तरह से वियतनामी सबटाइटल पर आधारित है, फिर भी एआई "सुपर," "कस्टमर," और "ट्रेड-ऑफ" जैसे शब्दों का गलत उच्चारण करता है, जिससे श्रोताओं को भ्रम होता है। इससे नीरसता, गलत संचार या मूल स्रोत से अपूर्ण सामग्री की समस्या उत्पन्न हो सकती है।
वीडियो अपलोड करने से पहले, क्रिएटर्स AI द्वारा प्रदान किए गए वॉइसओवर का प्रीव्यू सुन सकेंगे। वियतनामी वॉइसओवर सपोर्ट वाले वीडियो में आमतौर पर वियतनामी टाइटल होगा, और उसके ठीक नीचे "वॉइसओवर" लिखा होगा।
कृत्रिम बुद्धिमत्ता हर चरण में मौजूद है, विचार निर्माण और वीडियो प्रदर्शन विश्लेषण से लेकर उपशीर्षक निर्माण और आवाज की नकल तक। यूट्यूब को उम्मीद है कि अगले पांच वर्षों के भीतर, अपलोड किए गए सभी वीडियो निर्माता की मूल आवाज और भावों को बरकरार रखते हुए स्वचालित रूप से कई भाषाओं में डब किए जा सकेंगे।
दिसंबर 2024 के अंत तक, यह फ़ीचर अंग्रेज़ी से अनुवाद करते समय नौ भाषाओं को सपोर्ट करता था। 2025 की शुरुआत में, YouTube के CEO नील मोहन ने आधिकारिक तौर पर पुष्टि की कि AI ऑटो-डबिंग सभी पार्टनर्स के लिए शुरू कर दिया जाएगा। अप्रैल तक, यह फ़ीचर सभी मोनेटाइज़्ड चैनलों के लिए चुपचाप एक्टिवेट कर दिया गया था।
इस फीचर से असंतुष्टि व्यक्त करने वाली एक रेडिट पोस्ट पर 100 से अधिक टिप्पणियाँ और 450 लाइक मिले। एक व्यक्ति ने तर्क दिया कि कई वॉइस-ओवर सॉफ्टवेयर प्रोग्राम पहले से ही काफी अच्छा काम करते हैं, और YouTube में स्वयं सबटाइटल हैं, जो उपयोगकर्ताओं की भाषा अनुवाद संबंधी आवश्यकताओं को पूरा करते हैं।
एक अन्य टिप्पणी में कहा गया कि एआई ने "स्पेसटाइम" को "स्पेयर टाइम" समझ लिया, जिससे गलत अनुवाद हुए। कई अन्य उपयोगकर्ताओं ने भी इस फीचर के अप्रभावी होने की शिकायत की और ऐप में इसे निष्क्रिय करने के तरीके खोजे।
यूट्यूब खुद मानता है कि एआई ऑटो-डबिंग अभी अपेक्षाकृत नई तकनीक है और वह उपयोगकर्ताओं की प्रतिक्रिया का स्वागत करता है। वीडियो पोस्ट करने से पहले, प्लेटफॉर्म वीडियो निर्माताओं को एआई की अर्थ, उच्चारण और ध्वनि भेद करने की क्षमता में सीमाओं के बारे में सूचित करेगा। दर्शकों के लिए वीडियो जारी करने से पहले उन्हें डबिंग की सटीकता की पुष्टि करनी होगी।
हालांकि, Air.io के अनुसार, यह फ़ीचर आज़माने लायक है। यह कम लागत में यह जांचने का तरीका है कि दर्शक किसी क्रिएटर के कंटेंट का आनंद ले रहे हैं या नहीं और क्या चैनल इन डब किए गए वर्ज़नों के ज़रिए नए दर्शकों को आकर्षित कर सकता है। भले ही यह तकनीक पूरी तरह से सही न हो, लेकिन इसमें कंटेंट की पहुंच बढ़ाने की क्षमता है।
फिलहाल, सभी वीडियो के डब संस्करण उपलब्ध नहीं होंगे, और उपयोगकर्ता इस सुविधा को डिफ़ॉल्ट रूप से बंद नहीं कर सकते। इसके बजाय, AI द्वारा डब किए गए संस्करणों की संख्या कम करने के लिए अपने ब्राउज़र की भाषा को अंग्रेज़ी में बदलने का प्रयास करें।
स्रोत: https://znews.vn/youtube-vua-dung-ai-de-pha-vo-rao-can-ngon-ngu-post1553547.html






टिप्पणी (0)