अमेरिका में एक बड़े कृत्रिम बुद्धिमत्ता संगठन के लिए काम करने के बाद, आपने घर लौटकर विनबिगडाटा में शामिल होने का निर्णय क्यों लिया?
अमेरिका में काम करते हुए, हालाँकि मैंने कई बड़ी सरकारी परियोजनाओं में भाग लिया, लेकिन मेरे द्वारा प्राप्त परिणाम अक्सर एक बड़ी प्रक्रिया के कुछ ही चरणों के बराबर होते थे। कई बार, परियोजनाओं की सख्त गोपनीयता के कारण, मुझे यह भी पता नहीं चलता था कि मेरे द्वारा विकसित समाधानों का उपयोग कैसे किया जा रहा है।
2017 में, मैं वियतनाम लौट आया जब वियतनाम विकास के चरण में था और बिग डेटा और आर्टिफिशियल इंटेलिजेंस से जुड़ी कई समस्याओं का समाधान ज़रूरी था। मैंने प्रोफ़ेसर वु हा वान का निमंत्रण स्वीकार किया ताकि वियतनामी लोगों के जीवन को बेहतर बनाने के लिए वियतनामी तकनीकी समाधान विकसित करने के लक्ष्य को संयुक्त रूप से साकार किया जा सके। मुझे वियतनाम लौटना ज़्यादा सार्थक लगा क्योंकि मैं ज़्यादा प्रभावशाली समस्याओं पर काम कर पाऊँगा।
डॉ. दाओ डुक मिन्ह एक कार्यशाला में
कृत्रिम बुद्धिमत्ता विकसित करने की रणनीति में बिग डेटा की क्या भूमिका और प्रभाव है, महोदय?
कृत्रिम बुद्धिमत्ता के प्रशिक्षण में डेटा एक बहुत बड़ी और महत्वपूर्ण भूमिका निभाता है। उच्च-गुणवत्ता वाले कृत्रिम बुद्धिमत्ता मॉडल का प्रशिक्षण अक्सर एक बड़े डेटाबेस के प्रशिक्षण से शुरू होता है। इसलिए, गुणवत्तापूर्ण कृत्रिम बुद्धिमत्ता के लिए, हमें सबसे पहले अच्छे डेटा की आवश्यकता होती है।
अच्छे डेटा के लिए मात्रा और पैमाने, गुणवत्ता, विविधता और सार्वभौमिकता आवश्यक है। कृत्रिम बुद्धिमत्ता मॉडल में फीड करने के लिए उच्चतम गुणवत्ता वाला डेटा तैयार करने हेतु कच्चे डेटा की सफाई के चरण से लेकर हज़ारों घंटों के डेटा को एकत्रित और संसाधित करने की प्रक्रिया बहुत महंगी और जटिल है। इसके विपरीत, बड़े डेटा का विश्लेषण करने के लिए, हमें बड़े पैमाने पर डेटा को सटीक रूप से संसाधित करने की क्षमता सुनिश्चित करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने की आवश्यकता है, जिससे बेहतर निर्णायक या पूर्वानुमानित परिणाम प्राप्त हों।
उदाहरण के लिए, वियतनामी लोगों (ViVi) के लिए एक आभासी सहायक उत्पाद विकसित करने की प्रक्रिया में, हमें विभिन्न क्षेत्रों, विभिन्न आयु और लिंगों से सैकड़ों-हजारों आवाज़ों से, सैकड़ों क्षेत्रों में फैली सामग्री के साथ, उच्च गुणवत्ता वाले ऑडियो डेटा के हजारों घंटे एकत्र और संसाधित करने पड़े...
या हाल ही में, ViGPT का लॉन्च - "अंतिम उपयोगकर्ताओं के लिए ChatGPT का पहला वियतनामी संस्करण", VinBigdata के पूर्ण स्वामित्व वाले एक बड़े भाषा मॉडल से विकसित किया गया है। इस मॉडल को कई अलग-अलग क्षेत्रों से 600 GB के परिष्कृत वियतनामी डेटा के आधार पर प्रशिक्षित किया गया है। वियतनामी डेटा और भाषा की हमारी समझ के साथ, हमने ChatGPT के जन्म के केवल 9 महीनों के भीतर ही ViGPT के लॉन्च समय को कम करने का एक नया तरीका खोज लिया है।
यह बिग डेटा और कृत्रिम बुद्धिमत्ता के बीच का संबंध है।
समुदाय की सेवा के लिए अनुसंधान को व्यावहारिक मूल्य से जोड़ने के बारे में आपका क्या विचार है?
- मेरा मानना है कि प्रौद्योगिकी अनुसंधान तभी सही मायने में सफल होता है जब वह वास्तव में जीवन में प्रवेश करता है, सामाजिक समस्याओं का समाधान करता है और लोगों के जीवन में सुधार करता है।
व्यावसायिक और सामाजिक समस्याओं को हल करने वाले व्यावहारिक वाणिज्यिक उत्पादों का निर्माण करने के लिए, हमें हमेशा ध्यान देना चाहिए और यह प्रश्न पूछना चाहिए: डेटा जीवन में क्या मूल्य लाएगा?
अब तक, हमने विभिन्न उद्योगों और क्षेत्रों के लिए विभिन्न प्रकार के उत्पादों और समाधानों पर शोध और विकास किया है, विशेष रूप से ViGPT, VinDr - चिकित्सा इमेजिंग निदान में AI समाधान प्रदान करना, VinBase - एक जैव-कृत्रिम बुद्धिमत्ता मंच, या Vizone - स्मार्ट छवि विश्लेषण समाधानों का एक सेट।
विन्ग्रुप कॉर्पोरेशन के एक कार्यक्रम में विन्बिगडाटा के प्रमुख कर्मचारियों के साथ
चौथी औद्योगिक क्रांति वैश्विक स्तर पर ज़ोरदार तरीके से हो रही है। आपके विचार से वियतनाम को क्या लाभ हैं?
पिछली क्रांतियों की तुलना में, मेरा मानना है कि वियतनाम के पास इस 4.0 औद्योगिक क्रांति में आगे बढ़ने के लिए कई फ़ायदे हैं, जिससे विश्व मानचित्र पर देश की स्थिति बेहतर हो सकती है। इस लक्ष्य को प्राप्त करने की दो कुंजियाँ हैं: आँकड़े और लोग।
वियतनाम की वर्तमान जनसंख्या लगभग 10 करोड़ है, जिनमें से युवाओं का एक बड़ा हिस्सा फ़ोन और पर्सनल कंप्यूटर का इस्तेमाल करता है। इसके अलावा, हमारे पास कृत्रिम बुद्धिमत्ता के प्रतिष्ठित विशेषज्ञ और सूचना प्रौद्योगिकी के क्षेत्र में उच्च-गुणवत्ता वाले युवा कर्मचारी हैं, और गणित में हमारी पकड़ बहुत मज़बूत है।
तो फिर सीमाएं क्या हैं?
पहली स्पष्ट सीमा यह है कि बड़ी आबादी होने के बावजूद, हमें अभी भी डेटा पर नियंत्रण रखने में कठिनाई हो रही है, विशेष रूप से सुविधाओं, व्यावसायिक इकाइयों और प्रशासनों में डेटा को मानकीकृत और समकालिक बनाने में।
इसके अलावा, हमें अन्य बाधाओं का भी सामना करना पड़ रहा है, जैसे सीमित निवेश संसाधन, विशेष रूप से उच्च प्रदर्शन कंप्यूटिंग अवसंरचना में निवेश।
आपकी राय में, वियतनामी लोगों के जीवन को बेहतर बनाने के लिए प्रौद्योगिकी के निर्माण और उसमें महारत हासिल करने की यात्रा में वियतनामी डेटा निपुणता की भूमिका कितनी महत्वपूर्ण है?
वर्तमान में दुनिया भर में कई अग्रणी कृत्रिम बुद्धिमत्ता उत्पाद मौजूद हैं, जिनमें आमतौर पर ओपनएआई से चैटजीपीटी या गूगल से बार्ड जैसे बड़े भाषा मॉडल पर आधारित जनरेटिव एआई अनुप्रयोग उत्पाद शामिल हैं। हालाँकि, इन उत्पादों के विकास के लिए वियतनामी मुख्य भाषा समूह नहीं है।
इसलिए, उपयोगकर्ताओं को लौटाई गई वियतनामी-विशिष्ट सामग्री की गुणवत्ता कमोबेश प्रभावित होती है और इसमें त्रुटियों की उच्च संभावना होती है, अधिक खतरनाक रूप से, बुनियादी ज्ञान में त्रुटियां होती हैं।
वियतनामी होने के नाते, हमें अपने स्वयं के डेटा स्रोतों तक पहुँच का लाभ प्राप्त है। केवल हमारे पास ही वियतनामी डेटा की विशेषताओं, वियतनामी लोगों की ज़रूरतों और विशेषताओं को समझने की क्षमता है। इसलिए, वियतनामी डेटा में महारत हासिल करना वास्तव में मुख्य तकनीकों में महारत हासिल करने की कुंजी है, जो कि वियतनामी लोगों की सेवा करने वाली तकनीकें हैं।
VinBigdata सदस्यों के लिए आंतरिक प्रशिक्षण
विशिष्ट डेटा स्रोतों तक कैसे पहुंच बनाई जाए, विशेषकर तब जब अधिकांश वियतनामी लोग विदेशों से सोशल नेटवर्किंग साइटों का उपयोग करते हैं?
वास्तविकता यह है कि आज मानव डेटा का सबसे बड़ा स्रोत (केवल वियतनामी ही नहीं) इंटरनेट और सोशल नेटवर्क पर है। हालाँकि, हम वियतनामी डेटा की विशेषताओं की समझ के आधार पर, प्रत्येक परियोजना द्वारा निर्धारित विशेषताओं के आधार पर, विभिन्न स्रोतों से डेटा तक पहुँच और संग्रह कर सकते हैं।
उदाहरण के लिए, OpenAI के GPT मॉडल में सैकड़ों, यहाँ तक कि खरबों पैरामीटर होते हैं, जिन्हें भारी मात्रा में डेटा पर प्रशिक्षित किया जाता है, और इनकी लागत अरबों डॉलर होती है। इनकी तुलना में, हमने अपने शोध, क्षमताओं और संसाधनों के आधार पर एक बिल्कुल अलग रास्ता चुना है: केवल कुछ अरब पैरामीटरों की वास्तुकला वाला एक वियतनामी भाषा मॉडल बनाना, जिसे 600 जीबी के वियतनामी डेटा सेट पर प्रशिक्षित किया गया है जिसे हमने स्वयं एकत्रित और परिष्कृत किया है, लेकिन वियतनामी प्रसंस्करण के संदर्भ में समान क्षमताओं के साथ। परिणाम बताते हैं कि हमारा स्व-विकसित आर्किटेक्चर स्वयं को अनुकूलित कर सकता है, भाषा मॉडल प्रशिक्षण समय को कम कर सकता है, लागत कम कर सकता है, और फिर भी मॉडल की गुणवत्ता सुनिश्चित कर सकता है।
कृत्रिम बुद्धिमत्ता उत्पादों पर शोध और विकास की प्रक्रिया में आपको और आपकी टीम को किन चुनौतियों का सामना करना पड़ा है?
पहली चुनौती निश्चित रूप से समय की है। कृत्रिम बुद्धिमत्ता तकनीक की लहर बहुत तेज़ी से आ रही है और विस्फोट के दौर में है। दुनिया भर की अग्रणी तकनीकी कंपनियों ने अत्यधिक पूर्ण, निरंतर अद्यतन और उन्नत उत्पाद तेज़ी से लॉन्च किए हैं। अगर हम धीमे रहे और समय पर उत्पाद लॉन्च नहीं किए, तो हम निश्चित रूप से पिछड़ जाएँगे।
दूसरी ओर, यदि हम ऐसे उत्पाद बनाना चाहते हैं जिन्हें लागू किया जा सके और जो व्यावहारिक सामाजिक समस्याओं को हल कर सकें, तो हमें उत्पाद की उत्कृष्ट, विशेष और अनूठी विशेषताओं को खोजने और विकसित करने पर भी विचार करना चाहिए।
वियतनाम आर्टिफिशियल इंटेलिजेंस दिवस (AI4VN 2023) पर प्रस्तुति
दरअसल, वियतनाम और दुनिया भर में कई व्यक्तियों और संगठनों को डेटा लीक के कारण भारी नुकसान हुआ है। आप डेटा सुरक्षा के मुद्दे को कैसे देखते हैं?
यह कहा जा सकता है कि आज कोई भी अनुप्रयोग डेटा से ही आता है। डेटा के साथ काम करते समय, एक ओर, हमें जीवन के लिए सर्वोत्तम तकनीक बनाने के लिए डेटा का उपयोग करने का लक्ष्य सुनिश्चित करना चाहिए, और दूसरी ओर, हमें व्यक्तियों और संगठनों के लिए डेटा सुरक्षा सुनिश्चित करनी चाहिए।
डेटा सुरक्षा आश्वासन प्रक्रिया में मानवीय पहलू एक अत्यंत महत्वपूर्ण कड़ी है। इनमें डेवलपर, उत्पाद उपयोगकर्ता और उपयोगकर्ता शामिल हैं। डेवलपर्स के लिए, डेटा संग्रह और प्रसंस्करण की शुरुआत से ही डेटा सुरक्षा के बारे में जागरूकता मौजूद होनी चाहिए।
अक्सर, जब कोई समस्या नहीं होती, तो हम डेटा सुरक्षा के महत्व से अनजान होते हैं। लेकिन अगर डेटा लीक हो जाए, तो नुकसान बहुत बड़ा हो सकता है। डेटा लीक तकनीकी समस्याओं या डेटा चोरी के लिए जानबूझकर किए गए हमलों के कारण हो सकता है। जब डेटा लीक होता है, तो व्यक्तियों या संगठनों की जानकारी का इस्तेमाल गलत लोगों द्वारा अवैध उद्देश्यों के लिए किया जा सकता है, और व्यवसायों को संबंधित समस्याओं को ठीक करने के लिए वित्तीय नुकसान उठाना पड़ सकता है, यहाँ तक कि उनके ब्रांड को भी नुकसान हो सकता है।
डॉ. दाओ डुक मिन्ह और विनबिगडाटा टीम एक कार्यक्रम में
वियतनामी लोगों की सेवा करने के लिए प्रौद्योगिकी में महारत हासिल करने की आकांक्षा के बाद, क्या विश्व में आगे बढ़ने के लिए कदम उठाए जाएंगे?
कोई भी संगठन या व्यवसाय जो अपने उत्पादों को अंतर्राष्ट्रीय बाज़ार में लाना चाहता है, उसे अंतर्राष्ट्रीय मानकों का पालन करना होगा। VinBigdata के पास समाधानों और तकनीक में मज़बूती है, इसलिए दुनिया पर विजय पाने का लक्ष्य निर्धारित करना स्वाभाविक है।
बेशक, कई अलग-अलग उत्पादों और अनुप्रयोगों के लिए तैनाती के लिए, दुनिया भर के उपयोगकर्ताओं के कई वर्षों के अनुभव और समझ के साथ अंतर्राष्ट्रीय इकाइयों का समर्थन होना आवश्यक है।
धन्यवाद!
[विज्ञापन_2]
स्रोत: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm
टिप्पणी (0)