दुनिया भर में एआई में रुचि बढ़ रही है, और ज़्यादातर ध्यान दुनिया के कई अग्रणी एआई मॉडल वाले देशों, जैसे अमेरिका और चीन, पर केंद्रित है। दक्षिण-पूर्व एशिया, जो दुनिया के महत्वपूर्ण आर्थिक क्षेत्रों में से एक है, धीरे-धीरे एआई के लिए एक नया आकर्षण का केंद्र बनता जा रहा है, जहाँ हो रही बड़ी प्रगति वैश्विक नीति निर्माताओं, निवेशकों और तकनीकी विशेषज्ञों के लिए रुचिकर हो सकती है।

वियतनाम में, पार्टी और सरकार देश के तकनीकी विकास के युग को आकार देने और उसे बढ़ावा देने के लिए भी प्रतिबद्ध हैं, जैसा कि विज्ञान और प्रौद्योगिकी विकास, नवाचार और राष्ट्रीय डिजिटल परिवर्तन में सफलता पर संकल्प 57-एनक्यू/टीडब्ल्यू के माध्यम से प्रदर्शित होता है। इस दिशा ने घरेलू प्रौद्योगिकी उद्यमों के लिए उन्नत वैश्विक प्रौद्योगिकी की क्षमता में निवेश और दोहन के लिए एक मजबूत प्रेरक शक्ति का निर्माण किया है।
वर्तमान में, वियतनाम दक्षिण-पूर्व एशिया के उन गिने-चुने देशों में से एक बन गया है जिनके पास एक घरेलू वृहद भाषा मॉडल (एलएलएम) है। विशेष रूप से, 2023 से, ज़ालो ने वियतनामी भाषा पर केंद्रित एक एलएलएम मॉडल का सफलतापूर्वक प्रशिक्षण और प्रक्षेपण किया है, जिसका शोध और विकास पूरी तरह से वियतनामी इंजीनियरों की एक टीम द्वारा किया गया है।
शुरुआत से ही प्रशिक्षण चुनें और अप्रत्याशित परिणाम प्राप्त करें
वर्तमान में, एआई मॉडल में 2 प्रशिक्षण तकनीकें शामिल हैं: फाइन-ट्यून्ड मॉडल तकनीक विशेष प्रयोजनों के लिए नए एलएलएम बनाने के लिए पहले से प्रशिक्षित एलएलएम को अनुकूलित करने की विधि है; स्क्रैच मॉडल प्रशिक्षण तकनीक एक पूरी तरह से नया मॉडल बनाने की प्रक्रिया है, जिसमें पैरामीटर आरंभीकरण से लेकर मॉडल आर्किटेक्चर पर निर्णय लेना और एक निश्चित डेटा सेट पर एल्गोरिदम को प्रशिक्षित करना शामिल है।
इनमें से, कई व्यवसाय फाइन-ट्यूनिंग तकनीकों को उनके आसान कार्यान्वयन, संसाधनों की बचत और बेहतर दक्षता जैसे लाभों के कारण चुनते हैं। विशेष रूप से, वियतनाम के संदर्भ में, जहाँ प्रशिक्षण उपकरण और डेटा सीमित हैं, फाइन-ट्यूनिंग तकनीकें एक बेहतर समाधान हैं।
हालाँकि, ज़ालो ने शुरू से ही प्रशिक्षण तकनीक को चुना। इस पद्धति के साथ, पूरी प्रशिक्षण प्रक्रिया और मॉडल पूरी तरह से वियतनामी लोगों के स्वामित्व और नियंत्रण में है। इसी वजह से, वियतनाम दक्षिण-पूर्व एशिया के उन गिने-चुने देशों में से एक बन गया है, जिनके पास घरेलू स्तर पर विकसित एक बड़ा भाषा मॉडल (एलएलएम) है।
2023 में लॉन्च के समय, ज़ालो के पहले बड़े पैमाने के भाषा मॉडल, जिसमें वियतनामी भाषा पर केंद्रित 7 अरब पैरामीटर थे, ने VMLU वियतनामी LLM योग्यता मूल्यांकन बेंचमार्क पर OpenAI के GPT3.5 की तुलना में 150% प्रदर्शन हासिल किया। प्रशिक्षण में केवल 6 महीने लगे, जो 18 महीने की मूल योजना से काफी कम था। इस तेज़ प्रशिक्षण प्रक्रिया ने ज़ालो की पूरी विकास टीम को आश्चर्यचकित कर दिया।

ज़ालो के एलएलएम मॉडल को 2023 में अपने पहले लॉन्च में कहूट चैलेंज में तीसरा स्थान मिला (फोटो: ज़ालो)।
2024 में, ज़ालो का 13 बिलियन पैरामीटर मॉडल दुनिया के बड़े नामों को पीछे छोड़ते हुए VMLU की वियतनामी LLM योग्यता रैंकिंग में शीर्ष 2 वियतनामी LLM मॉडल के रूप में अपनी स्थिति की पुष्टि करेगा।
परिणाम दर्शाते हैं कि वियतनाम के अपने एआई मॉडल को विकसित करने के लिए बड़े भाषा मॉडल के प्रशिक्षण का स्तर दुनिया के स्तर से कम नहीं है, विशेष रूप से प्रारंभिक विकास कठिनाइयों के संदर्भ में।
एआई मॉडल विकसित करने के वियतनामी प्रयास
ज़ालो के प्रतिनिधि ने कहा कि एलएलएम प्रशिक्षण के लिए तीन मुख्य तत्वों की आवश्यकता होती है: प्रशिक्षण उपकरण, डेटा और तकनीकी स्तर। इससे पहले, वियतनाम में, इन तीनों पहलुओं में अभी भी कई सीमाएँ थीं। विशेष रूप से, जहाँ दुनिया की बड़ी कंपनियों के पास एनवीडिया के हज़ारों नवीनतम उच्च-प्रदर्शन वाले जीपीयू हैं, वहीं वियतनाम में इंजीनियर अभी भी आवश्यक सर्वर इंफ्रास्ट्रक्चर से पूरी तरह सुसज्जित नहीं हैं। साथ ही, वियतनामी भाषा को अंग्रेजी या चीनी भाषाओं की तुलना में कम डेटा संसाधनों वाले समूह में भी स्थान दिया गया है। विकसित देशों की तुलना में वियतनाम के मानव संसाधन और एलएलएम प्रशिक्षण का अनुभव भी सीमित है।
उस समय ज़ालो टीम को छोटे नागरिक GPU पर अनुसंधान और प्रयोग करना पड़ा ताकि वे स्वयं को ज्ञान और LLM प्रशिक्षण क्षमताओं से लैस कर सकें, तथा बड़े कंप्यूटिंग बुनियादी ढांचे के उपलब्ध होते ही तैयार हो सकें।
एआई प्रशिक्षण चिप्स दुर्लभ हैं, इसलिए भले ही ज़ालो ने 8 एनवीडिया डीजीएक्स एच100 सर्वर ऑर्डर किए हों, वह एक साथ सभी डिवाइस का मालिक नहीं हो सकता और उसे निर्माता से प्रत्येक बैच की डिलीवरी का इंतज़ार करना होगा। इसलिए, प्रशिक्षण समय बचाने के लिए अधूरे कंप्यूटिंग इंफ्रास्ट्रक्चर का अनुकूलन करना भी एक समस्या है जिसका समाधान ज़ालो टीम को करना होगा।
साथ ही, वियतनामी डेटा स्रोतों की कमी की भरपाई के लिए गुणवत्तापूर्ण प्रशिक्षण डेटा में भी निवेश किया जाता है।

"हालांकि दुनिया की बड़ी कंपनियों की तुलना में शुरुआती बिंदु कठिन था, फिर भी ज़ालो ने वियतनाम के अपने एआई मॉडल को सफलतापूर्वक विकसित करने के लक्ष्य के साथ इस दौड़ में शामिल होने का फैसला किया। हमने एक उपयुक्त विकास रणनीति बनाने के लिए दुनिया के कई प्रमुख शोध संस्थानों के शोधकर्ताओं और इंजीनियरों से परामर्श किया।"
ज़ालो एआई के विज्ञान निदेशक डॉ. गुयेन ट्रुओंग सोन ने कहा, "सफलता के वर्तमान मील के पत्थर ज़ालो इंजीनियरों के लिए मॉडल को और अधिक व्यापक और बेहतर गुणवत्ता प्रदान करने के लिए निरंतर अनुकूलन की प्रेरणा हैं। साथ ही, वियतनामी उपयोगकर्ताओं के लिए कई विश्वस्तरीय एआई उत्पाद बनाने हेतु इसकी प्रयोज्यता का दोहन करना भी आवश्यक है।"

DGX H100 सर्वर ज़ालो ने Nvidia से ऑर्डर किया (फोटो: ज़ालो)।
विकास के कठिन प्रारंभिक चरणों में लचीले अनुकूलन के कारण, ज़ालो ने धीरे-धीरे सफल मील के पत्थर हासिल किए हैं, तथा आज की वैश्विक एआई प्रौद्योगिकी में महारत हासिल करने की दिशा में आगे बढ़ रहा है।
वर्तमान में, ज़ालो का एआई मॉडल न केवल प्रशिक्षण अनुसंधान के संदर्भ में सफल है, बल्कि वियतनामी लोगों के लिए उन्नत नई तकनीक तक पहुंच और मूल्य के दोहन को बढ़ावा देने के लिए भी लागू किया गया है।
इस साल की शुरुआत में, ज़ालो ने किकी इन्फो क्यू एंड ए असिस्टेंट लॉन्च किया था, जिसे ज़ालो मैसेजिंग प्लेटफ़ॉर्म पर एक ओए (आधिकारिक अकाउंट) के रूप में संचालित किया जा रहा है। यह असिस्टेंट जीवन, कंटेंट निर्माण और मनोरंजन से जुड़े विभिन्न विषयों पर प्रश्नोत्तर का समर्थन करता है। ज़ालो के आंकड़ों के अनुसार, किकी इन्फो असिस्टेंट के ओए अकाउंट को ज़ालो पर 2 महीने से भी कम समय में 10 लाख से ज़्यादा उपयोगकर्ताओं ने एक्सेस किया है।

ज़ालो के एलएलएम मॉडल को किकी इन्फो असिस्टेंट को विकसित करने के लिए लागू किया गया है (फोटो: ज़ालो)।
ज़ालो के एलएलएम मॉडल का एक और अनुप्रयोग एआई कार्ड्स है, जिसने भी केवल 2 महीनों में 15 मिलियन कार्ड बनाने और भेजने का आंकड़ा पार कर लिया है। यह एक ऐसा एप्लिकेशन है जिसमें कई ज़ालो उपयोगकर्ता महत्वपूर्ण छुट्टियों पर रिश्तेदारों और दोस्तों को शुभकामनाएँ भेजने में रुचि रखते हैं।
वर्तमान में, ज़ालो द्वारा बड़े भाषा मॉडल के अनुप्रयोगों का विस्तार और विकास जारी है, जो घरेलू उपयोगकर्ताओं के लिए कई उपयोगी मूल्य लाने का वादा करता है।
स्रोत: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm






टिप्पणी (0)