व्यापारिक यात्रा से लौट रहे लोगों की भीड़-भाड़ के बीच हवाई अड्डे की लॉबी में प्रवेश करते समय हो मिन्ह डुक कुछ सेकंड के लिए रुक गए, जब उन्होंने एक परिचित, सौम्य महिला की आवाज सुनी जो सिस्टम पर एक घोषणा पढ़ रही थी।
वीबी के कर्मचारी हनोई स्थित कंपनी मुख्यालय में काम कर रहे हैं - फोटो: एनवीसीसी
वह मुस्कुराया, राहत और खुशी महसूस कर रहा था मानो किसी रिश्तेदार से मिल गया हो। वह "रिश्तेदार" उन 20 एआई आवाज़ों में से एक थी जिनके साथ डक और वीबी टीम ने कई दिनों और महीनों तक "खाया और सोया" था, हर ध्वनि पंक्ति में अपना पूरा दिल लगाया था, आवाज़ की हर बारीकियों का ध्यान रखा था ताकि वे ज़्यादा स्वाभाविक और मानवीय लगें।
उबड़-खाबड़ शुरुआत
मुझे नहीं पता कि वीबी डेटा सॉल्यूशंस एंड सर्विसेज ज्वाइंट स्टॉक कंपनी के दो संस्थापकों - सीईओ हो मिन्ह डुक और सीटीओ गुयेन थी थू ट्रांग - ने कितनी बार खुशी और गर्व की ऐसी भावना का अनुभव किया है।
वे कई अलग-अलग परिस्थितियों में "विशेष परिचितों" से मिले: स्कूल के लाउडस्पीकर सिस्टम पर स्पष्ट आवाजें, इमारतों में गर्मजोशी भरी आवाजें, या कई व्यवसायों के स्वचालित स्विचबोर्ड से पेशेवर आवाजें।
वीबी के दिमाग की उपज अब केवल एल्गोरिदम और कोड का परिणाम नहीं है, बल्कि वास्तव में जीवन में प्रवेश कर रही है, तथा कई क्षेत्रों में मौन लेकिन शक्तिशाली योगदान दे रही है।
पुस्तक परिचय, फिल्म डबिंग से लेकर स्वचालित कॉल सेंटर घोषणाओं तक, वीबीई आवाज प्रौद्योगिकी में नई जान फूंकता है।
कोर टीटीएस प्रौद्योगिकी की "माता" के रूप में, डॉ. गुयेन थी थू ट्रांग हमेशा वियतनामी भाषण संश्लेषण प्रौद्योगिकी से उत्पादों को वास्तविक उपयोगकर्ताओं तक लाने की आकांक्षा रखती हैं - वह प्रौद्योगिकी जिस पर उन्होंने पेरिस 11 विश्वविद्यालय में अपने डॉक्टरेट थीसिस के बाद से बहुत प्रयास किया है।
Vbee के शुरुआती दिन मुश्किल भरे रहे। शुरुआती दो साल मुफ़्त होने के बावजूद, इसके टेक्स्ट-टू-स्पीच (TTS) टूल ने बहुत कम लोगों को आकर्षित किया। लेकिन फिर COVID-19 एक अप्रत्याशित मोड़ लेकर आया।
सामाजिक दूरी के सख्त नियमों का सामना करते हुए, एफई क्रेडिट, मोमो, वियत क्रेडिट, सैकोमबैंक जैसी कंपनियों को हज़ारों ग्राहकों तक पहुँचने के तरीके ढूँढ़ने पड़े। तभी वीबी को मौका मिला: ऋण अनुस्मारक से लेकर स्वचालित प्रतिक्रियाओं तक, उनके उत्पाद तुरंत सर्वोत्तम समाधान बन गए। उस समय, वर्चुअल असिस्टेंट और वर्चुअल कॉल सेंटर वीबी के राजस्व का 80% तक लाते थे।
जब महामारी खत्म हुई और विश्व अर्थव्यवस्था में गिरावट आई, तो Vbee को एक नई चुनौती का सामना करना पड़ा। जनरेटिव AI (GenAI) और डिजिटल कंटेंट ट्रेंड्स की लहर ने TTS टूल को पुनर्जीवित कर दिया। आज, TikTok से लेकर YouTube और Facebook तक, Vbee की AI आवाज़ें हर जगह हैं।
"वर्तमान में हम बहुत सारी टीटीएस सामग्री प्रदान करते हैं," श्री हो मिन्ह डुक ने गर्व से बताया। वर्तमान में, वीबी के वास्तविक उपयोगकर्ताओं की संख्या 20 लाख से अधिक हो गई है, और यह संख्या अभी भी हर महीने 20% की दर से लगातार बढ़ रही है।
वीबी ने 20 से अधिक उच्च गुणवत्ता वाली कॉर्पोरेट आवाज़ों को प्रशिक्षित किया है, और यदि आप कस्टम आवाज़ों को भी शामिल करें, तो उन्होंने 200 से अधिक विभिन्न एआई आवाज़ें बनाई हैं।
हाल ही में शोध और परीक्षण की गई नई आवाज प्रतिलेखन तकनीक के साथ, अब एक नई आवाज को प्रशिक्षित करने के लिए केवल 3 मिनट के रिकॉर्ड किए गए डेटा की आवश्यकता होती है, जबकि दो साल पहले 4 से दर्जनों घंटों की रिकॉर्डिंग की आवश्यकता होती थी।
सीईओ हो मिन्ह डुक और मुख्य प्रौद्योगिकी अधिकारी गुयेन थी थु ट्रांग - वीबी डेटा सॉल्यूशंस एंड सर्विसेज ज्वाइंट स्टॉक कंपनी के दो संस्थापक - फोटो: एनवीसीसी
"हम वियतनामी भाषा को बेहतर ढंग से समझते हैं"
भाषण संश्लेषण प्रौद्योगिकी की दौड़ में, सीईओ हो मिन्ह डुक एक ऐसे समय को देखते हैं जब तकनीकी नवाचार के प्रयास धीरे-धीरे अपनी सीमा तक पहुंच जाएंगे।
उनके अनुसार, वीबी न केवल वियतनामी भाषा के प्रसंस्करण के लिए कोर प्रौद्योगिकी विकसित कर रहा है, बल्कि वियतनामी भाषा को गहराई से समझने में सक्षम प्रौद्योगिकी प्रणाली का निर्माण भी कर रहा है - सभी सूक्ष्मताओं, लहजे और अनूठी संस्कृति के साथ, जिसे केवल सच्चे वियतनामी लोग ही पूरी तरह से समझ सकते हैं।
वियतनाम में टीटीएस बाज़ार में अग्रणी कंपनी के रूप में, वीबी के दोनों प्रमुखों का मानना है कि उनका उपकरण वियतनामी लोगों के लिए एआई वॉइस रीडिंग का मानक बन गया है। उपयोगकर्ता न केवल सटीकता की सराहना करते हैं, बल्कि वीबी द्वारा विकसित प्रत्येक आवाज़ में "भावना" भी महसूस करते हैं।
उदाहरण के लिए, वियतनामी में, "एली" शब्द के क्षेत्र के आधार पर कई अलग-अलग नाम हैं, जैसे "हेम", "किएट", "एक्सेक" - प्रत्येक शब्द का एक अलग अर्थ होता है जिसे एआई को समझने की आवश्यकता होती है।
इसे प्राप्त करने के लिए, Vbee ने नमूना डेटा सेट एकत्र करने के साथ-साथ AI प्रशिक्षण के लिए शक्तिशाली सर्वर प्रणालियों में भारी निवेश किया है।
सीईओ हो मिन्ह डुक ने बताया, "एआई को प्रत्येक क्षेत्रीय बारीकियों को सही ढंग से समझने और संसाधित करने में मदद करने के लिए, हमें अनगिनत नमूना सेट बनाने पड़े, और प्रसंस्करण सर्वर की लागत भी बहुत अधिक थी।"
डॉ. गुयेन थी थु ट्रांग ने वियतनामी भाषा के अनूठे स्वर और व्याकरण को समझने के लिए वीबी की मुख्य टीटीएस तकनीक पर 15 साल से ज़्यादा समय तक शोध किया है। उनके लिए, उनकी मातृभाषा अभिव्यक्ति की बारीकियों से भरी एक सूक्ष्म दुनिया है।
"मेरी वियतनामी भाषा बहुत जटिल और दिलचस्प है, इसके स्वर दुनिया की कई अन्य लोकप्रिय भाषाओं से सबसे कठिन और अलग हैं। मैं इस भाषा को जितना ज़्यादा समझूँगी, मेरा मॉडल उतना ही सटीक होगा," उन्होंने बताया।
वीबी धीरे-धीरे यह दावा कर रहा है कि वे प्रौद्योगिकी युग में एकीकृत वियतनामी भाषा प्रसंस्करण सॉफ्टवेयर के साथ उपकरणों और उपकरणों का एक अनिवार्य हिस्सा होंगे।
हर शब्द, हर आवाज में, Vbee टीम न केवल प्रौद्योगिकी पर शोध और विकास करती है, बल्कि अपनी AI आवाजों में वास्तव में "वियतनामी भावना" पैदा करने का भी प्रयास करती है।
वीबी नाम वियतनामी मुहावरे "बी योर आइज़" का संक्षिप्त रूप है, जो मेरी शुरुआती इच्छा से उपजा है कि मैं एक ऐसा उपकरण बनाऊँ जो दृष्टिबाधित लोगों की "आँखें" बन जाए। लेकिन वर्तमान विकास के दौर में, जब बहुत से लोग देखने से ज़्यादा सुनने पर ध्यान केंद्रित करना चाहते हैं, हमारा मानना है कि वीबी भी सबकी "आँखें" बन जाएगा।
डॉ. गुयेन थी थू ट्रांग (व्याख्याता, सूचना प्रौद्योगिकी स्कूल, हनोई विज्ञान और प्रौद्योगिकी विश्वविद्यालय, वीबीई कंपनी के संस्थापक और प्रौद्योगिकी निदेशक)
ऑडियोबुक प्रेमियों की बैठक
वीबी का जन्म डॉ. गुयेन थी थू ट्रांग और दृष्टिहीन समुदाय के बीच संबंधों से हुआ। अपने छात्र जीवन से ही, उन्होंने दृष्टिहीनों की सहायता के लिए ऑडियोबुक रिकॉर्ड करने और एक वियतनामी रीडर विकसित करने में भाग लिया है।
इन अनुभवों ने उन्हें वियतनामी पठन सॉफ़्टवेयर विकसित करने के लिए प्रेरित किया – जो Vbee का पूर्ववर्ती था। 2018 में, उन्होंने और हनोई विज्ञान एवं प्रौद्योगिकी विश्वविद्यालय में उनके सहपाठी श्री हो मिन्ह डुक, जिन्हें Socbay.com परियोजना और ऑडियोबुक्स के डिजिटलीकरण का अनुभव था, ने Vbee की स्थापना की, जो वियतनाम में टेक्स्ट-टू-स्पीच रूपांतरण के क्षेत्र में अग्रणी है।
Vbee की उत्कृष्ट उपलब्धियाँ
- क्वालकॉम वियतनाम इनोवेशन चैलेंज 2024 का प्रथम पुरस्कार
- विशेष पुरस्कार तुओई ट्रे स्टार्ट-अप पुरस्कार 2023
- ग्रैब वेंचर इग्नाइट 2020 एक्सेलेरेटर कार्यक्रम में विजेता स्टार्ट-अप
- वियतनामी प्रतिभा 2018 का प्रथम पुरस्कार, वियतनामी प्रतिभा 2020 का द्वितीय पुरस्कार
- सूचना और संचार मंत्रालय के राष्ट्रीय डिजिटल परिवर्तन कार्यक्रम 2025 - 2030 में वियतनामी कोर प्रौद्योगिकी का प्रमाण पत्र
- वियतनाम डिजिटल मीडिया अवार्ड 2018 और विन्ग्रुप फंड 2019 में विजेता परियोजना।
क्षेत्रीय दृष्टि
वियतनामी बाजार में अपनी स्थिति मजबूत करने के बाद, Vbee दक्षिण-पूर्व एशिया में विस्तार करने का लक्ष्य लेकर चल रहा है तथा 2026 तक अपनी TTS प्रौद्योगिकी को लाओस, थाईलैंड, कंबोडिया और फिलीपींस जैसे देशों में लाने की योजना बना रहा है।
डॉ. गुयेन थी थू ट्रांग के अनुसार, बहुभाषी मॉडलों के उद्भव के साथ आज प्रौद्योगिकी की तीव्र प्रगति से अन्य भाषाओं के लिए टीटीएस उपकरण विकसित करना आसान हो जाएगा।
वर्तमान में, वह थाई, चीनी और अंग्रेजी के लिए भाषण प्रौद्योगिकियों पर शोध कर रही हैं, जिससे अंतर्राष्ट्रीय बाजार में Vbee के लिए नए कदम खुलेंगे।
[विज्ञापन_2]
स्रोत: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
टिप्पणी (0)