v7 का इंटरफ़ेस, AI एकीकृत कीबोर्ड। फोटो: NVCC । |
त्रि थुक - Znews के साथ साझा करते हुए , त्रि डक (जन्म 2003) ने वियतनामी भाषा में प्रवेश के तरीके को बदलने के लिए कृत्रिम बुद्धिमत्ता के प्रयोग के विचार पर बात की। उनका छात्र प्रोजेक्ट, v7 टाइपिंग टूल, अब एक शोध पत्र के रूप में विकसित हो चुका है और इसे AI पर एक प्रतिष्ठित सम्मेलन, IJCAI 2025 में स्वीकार कर लिया गया है।
दशकों से लोकप्रिय होने के बावजूद, टेलेक्स या वीएनआई टाइपिंग में अभी भी उपयोगकर्ता अनुभव की कई सीमाएँ हैं। इसलिए, वी7 का जन्म एक हल्का-फुल्का भविष्यवाणी उपकरण बनने के लिए हुआ, जो एआई एकीकरण की बदौलत वियतनामी टाइपिंग में लगने वाले समय को कम करने में मदद करता है।
भाषाओं और प्रौद्योगिकी के प्रति जुनून
भाषाओं और प्रौद्योगिकी के प्रति उनके प्रेम ने उन्हें हो ची मिन्ह सिटी यूनिवर्सिटी ऑफ टेक्नोलॉजी में एप्लाइड आर्टिफिशियल इंटेलिजेंस में प्रमुखता दिलाई।
अपनी पढ़ाई के दौरान, उन्होंने वियतनामी भाषा के लिए एक बड़े भाषा मॉडल (एलएलएम), जातीय अल्पसंख्यक भाषाओं के अनुवाद के लिए एक सॉफ्टवेयर, या प्रवेश प्रक्रिया में सहायता के लिए एक चैटबॉट जैसी परियोजनाओं पर काम किया। उन्होंने बताया, "इन अनुभवों ने मुझे ज्ञान का एक ठोस आधार तैयार करने, समुदाय के लिए उपयोगी उत्पाद बनाने हेतु एआई का उपयोग करने के अपने जुनून और इच्छा को पोषित करने में मदद की।"
ट्राई डुक एआई को जीवन में लागू करके मूल्य लाना चाहते हैं। फोटो: एनवीसीसी। |
इसके अलावा, मंदारिन और कैंटोनीज़ की पृष्ठभूमि के साथ, डुक को पिनयिन/ज्युत्पिंग और वियतनामी वर्तनी के बीच के संबंध का एहसास हुआ। इससे यह भी पता चलता है कि चित्रलिपि की जटिलता के विपरीत, चीनी पिनयिन टाइपिंग प्रणाली में हमारे देश का नाम हान अक्षरों में लिखने के लिए केवल "yn" टाइप करना होता है। जबकि टेलेक्स या VNI को "वियतनाम" शब्द लिखने के लिए 10 कुंजियों की आवश्यकता होती है।
अपने अवलोकनों से, ड्यूक को एहसास हुआ कि तेज़ी से संवाद करते समय, उपयोगकर्ता अक्सर पहला व्यंजन रखकर संक्षिप्तीकरण करते हैं, जैसे "student" के लिए "hs"। उन्होंने इस विचार को जन्म देने वाली परिस्थितियों के बारे में कहा, "अगर इंसान इस लेखन शैली को आसानी से समझ सकते हैं, तो सही डेटा के साथ प्रशिक्षित होने पर AI भी इसे पूरी तरह से समझ सकता है।"
टेलेक्स या वीएनआई जैसे पारंपरिक टाइपिंग टूल्स (जो पूरक तंत्र का पालन करते हैं) का उपयोग करते समय पूरा अक्षर लिखने और फिर उच्चारण जोड़ने के बजाय, v7 आपको लिखने के लिए इच्छित शब्द का सुझाव देने के लिए AI का उपयोग करता है। यह तकनीक कम से कम कुंजियों के साथ पूरे शब्द का सटीक अनुमान लगा लेगी।
वियतनामी वर्तनी संरचना में, एक शब्द प्रारंभिक व्यंजन, तुक और स्वर से मिलकर बनता है। उदाहरण के लिए, "न्गुयेन" शब्द "न्ग", "उयेन" और एक गिरते हुए स्वर से बना है। इसी सिद्धांत के आधार पर, v7 टाइपिंग इंजन केवल प्रारंभिक व्यंजन और स्वर से पूरे शब्दों का अनुमान लगाने के लिए बनाया गया है, जिससे सटीकता बनाए रखते हुए कीस्ट्रोक्स की संख्या में उल्लेखनीय कमी आती है।
एआई को वियतनामी भाषा सिखाने की चुनौती
ड्यूक के अनुसार, सबसे बड़ी चुनौती इस टाइपिंग टूल के लिए वियतनामी भाषा को "समझना" सिखाना था। उन्होंने GPT-2 को आधार बनाने से पहले कई मॉडल आज़माए, जिसमें अच्छी संदर्भ समझ और सटीक शब्द भविष्यवाणी के लिए ट्रांसफ़ॉर्मर्स आर्किटेक्चर का इस्तेमाल किया गया था।
अंतर्निहित आर्किटेक्चर चुनने के बाद, डुक ने टोकनाइज़र (शब्दावली एनकोडर) को पूरी तरह से अपनी बनाई वियतनामी शब्दावली से बदल दिया। इंजीनियर ने व्यापक प्रसंस्करण सुनिश्चित करने के लिए सभी मान्य, सही वर्तनी वाले वियतनामी शब्दों को फ़िल्टर किया और उपयोगकर्ता द्वारा लिखे जाने वाले किसी भी शब्द का अनुमान लगाया।
एक और चुनौती भविष्यसूचक प्रदर्शन और प्रतिक्रिया गति के बीच संतुलन बनाने की है, ताकि यह सुनिश्चित हो सके कि मॉडल कंप्यूटर और फ़ोन, दोनों पर वास्तविक समय में चल सके, और फिर भी सर्वोत्तम भविष्यवाणियाँ करने के लिए पर्याप्त शक्तिशाली हो। दो महीने के निरंतर परीक्षण के बाद, वर्तमान संस्करण उपयोगकर्ताओं द्वारा टाइप किए गए लगभग 70% शब्दों को केवल 0.03 सेकंड की विलंबता के साथ सही ढंग से शीर्ष पर लाता है।
कीबोर्ड की इनपुट विधि के संबंध में, डुक द्वारा भाषाविद् काओ झुआन हाओ या हेनरी मास्पेरो से प्राप्त कई अध्ययनों के अनुसार, वियतनामी में केवल 6 नहीं, बल्कि 8 स्वर होते हैं। इस सुविधा का लाभ उठाने के लिए, v7 सामान्य 6 के बजाय 8-स्वर प्रणाली का उपयोग करता है (जिसमें एक सपाट स्वर और 5 उच्चारण स्वर शामिल हैं: तीव्र, सपाट, प्रश्नवाचक, गिरता हुआ, भारी)। इस कीबोर्ड में, "v7" टाइप करने पर, मॉडल "वियत" शब्द सुझाएगा। उत्पाद के नाम का विचार भी इसी पर आधारित है।
अपने सोशल नेटवर्क पर v7 शेयर करने के बाद, डुक ने कहा कि उन्हें बहुत खुशी और हैरानी हुई जब मॉडल को ध्यान, समर्थन और अनुभव की इच्छा मिली। उन्होंने कहा, "इससे मुझे एक ज़्यादा स्मार्ट और तेज़ वियतनामी टाइपिंग टूल की ज़रूरत का साफ़ एहसास हुआ।"
वैज्ञानिक शोध लेख के लेखकों का समूह। बाएँ से: नहत खांग, हियु न्घिया और त्रि डुक। फोटो: एनवीसीसी। |
फिलहाल, कीबोर्ड अभी भी प्रोटोटाइप चरण में है, और प्रोग्रामर या तकनीकी उपयोगकर्ताओं के परीक्षण और योगदान के लिए GitHub पर ओपन सोर्स कोड उपलब्ध है। आम उपयोगकर्ताओं के लिए विंडोज़ और macOS के लिए एक पूर्ण एप्लिकेशन संस्करण भी विकसित किया जा रहा है ताकि इसे आसानी से इंस्टॉल और इस्तेमाल किया जा सके।
भविष्य में, v7 की सर्वोच्च प्राथमिकता iPhone पर कीबोर्ड संस्करण है, ताकि स्मार्टफ़ोन पर वियतनामी टेक्स्ट दर्ज करने के तरीके में सुधार हो सके। इसके अलावा, दैनिक वार्तालाप डेटा पर अधिक प्रशिक्षण देकर मॉडल की सटीकता में सुधार किया जाएगा, जिससे AI को सामान्य संदर्भों को बेहतर ढंग से समझने में मदद मिलेगी।
डुक की यात्रा ने रचनात्मकता को नई ऊर्जा दी है, और वियतनाम में एआई इंफ्रास्ट्रक्चर में भारी निवेश के संदर्भ में तकनीकी रुझानों के साथ तालमेल बिठाया है। एक पल जो उन्हें गर्व से भर देता है, वह है जब v7 ने पहली बार एक पूरा वाक्य बनाया था। डुक ने कहा, "यह वह समय था जब एक छोटा मॉडल, जो आज के चैटजीपीटी के आकार का शायद केवल 1/10,000 था, फिर भी इंसान की तरह सोच सकता था।"
स्रोत: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html
टिप्पणी (0)