Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

'वियतनामी डेटा पर महारत हासिल करना वियतनामी प्रौद्योगिकी के विकास और उसमें महारत हासिल करने की दिशा में पहला कदम है'

Báo Thanh niênBáo Thanh niên27/05/2024

[विज्ञापन_1]
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 1.

अमेरिका में एक बड़े कृत्रिम बुद्धिमत्ता संगठन के लिए काम करने के बाद, आपने घर लौटकर विनबिगडाटा में शामिल होने का निर्णय क्यों लिया?

अमेरिका में काम करते हुए, हालाँकि मैंने कई बड़ी सरकारी परियोजनाओं में भाग लिया, लेकिन मेरे द्वारा प्राप्त परिणाम अक्सर एक बड़ी प्रक्रिया के कुछ ही चरणों के बराबर होते थे। कई बार, परियोजनाओं की सख्त गोपनीयता के कारण, मुझे यह भी पता नहीं चलता था कि मेरे द्वारा विकसित समाधानों का उपयोग कैसे किया जा रहा है।

2017 में, मैं वियतनाम लौट आया जब वियतनाम विकास के चरण में था और बिग डेटा और आर्टिफिशियल इंटेलिजेंस से जुड़ी कई समस्याओं का समाधान ज़रूरी था। मैंने प्रोफ़ेसर वु हा वान का निमंत्रण स्वीकार किया ताकि वियतनामी लोगों के जीवन को बेहतर बनाने के लिए वियतनामी तकनीकी समाधान विकसित करने के लक्ष्य को संयुक्त रूप से साकार किया जा सके। मुझे वियतनाम लौटना ज़्यादा सार्थक लगा क्योंकि मैं ज़्यादा प्रभावशाली समस्याओं पर काम कर पाऊँगा।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 2.

डॉ. दाओ डुक मिन्ह एक कार्यशाला में

कृत्रिम बुद्धिमत्ता विकसित करने की रणनीति में बिग डेटा की क्या भूमिका और प्रभाव है, महोदय?

कृत्रिम बुद्धिमत्ता के प्रशिक्षण में डेटा एक बहुत बड़ी और महत्वपूर्ण भूमिका निभाता है। उच्च-गुणवत्ता वाले कृत्रिम बुद्धिमत्ता मॉडल का प्रशिक्षण अक्सर एक बड़े डेटाबेस के प्रशिक्षण से शुरू होता है। इसलिए, गुणवत्तापूर्ण कृत्रिम बुद्धिमत्ता के लिए, हमें सबसे पहले अच्छे डेटा की आवश्यकता होती है।

अच्छे डेटा के लिए मात्रा और पैमाने, गुणवत्ता, विविधता और सार्वभौमिकता आवश्यक है। कृत्रिम बुद्धिमत्ता मॉडल में फीड करने के लिए उच्चतम गुणवत्ता वाला डेटा तैयार करने हेतु कच्चे डेटा की सफाई के चरण से लेकर हज़ारों घंटों के डेटा को एकत्रित और संसाधित करने की प्रक्रिया बहुत महंगी और जटिल है। इसके विपरीत, बड़े डेटा का विश्लेषण करने के लिए, हमें बड़े पैमाने पर डेटा को सटीक रूप से संसाधित करने की क्षमता सुनिश्चित करने के लिए कृत्रिम बुद्धिमत्ता का उपयोग करने की आवश्यकता है, जिससे बेहतर निर्णायक या पूर्वानुमानित परिणाम प्राप्त हों।

उदाहरण के लिए, वियतनामी लोगों (ViVi) के लिए एक आभासी सहायक उत्पाद विकसित करने की प्रक्रिया में, हमें विभिन्न क्षेत्रों, विभिन्न आयु और लिंगों से सैकड़ों-हजारों आवाज़ों से, सैकड़ों क्षेत्रों में फैली सामग्री के साथ, उच्च गुणवत्ता वाले ऑडियो डेटा के हजारों घंटे एकत्र और संसाधित करने पड़े...

या हाल ही में, ViGPT का लॉन्च - "अंतिम उपयोगकर्ताओं के लिए ChatGPT का पहला वियतनामी संस्करण", VinBigdata के पूर्ण स्वामित्व वाले एक बड़े भाषा मॉडल से विकसित किया गया है। इस मॉडल को कई अलग-अलग क्षेत्रों से 600 GB के परिष्कृत वियतनामी डेटा के आधार पर प्रशिक्षित किया गया है। वियतनामी डेटा और भाषा की हमारी समझ के साथ, हमने ChatGPT के जन्म के केवल 9 महीनों के भीतर ही ViGPT के लॉन्च समय को कम करने का एक नया तरीका खोज लिया है।

यह बिग डेटा और कृत्रिम बुद्धिमत्ता के बीच का संबंध है।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 3.
TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 4.

समुदाय की सेवा के लिए अनुसंधान को व्यावहारिक मूल्य से जोड़ने के बारे में आपका क्या विचार है?

- मेरा मानना ​​है कि प्रौद्योगिकी अनुसंधान तभी सही मायने में सफल होता है जब वह वास्तव में जीवन में प्रवेश करता है, सामाजिक समस्याओं का समाधान करता है और लोगों के जीवन में सुधार करता है।

व्यावसायिक और सामाजिक समस्याओं को हल करने वाले व्यावहारिक वाणिज्यिक उत्पादों का निर्माण करने के लिए, हमें हमेशा ध्यान देना चाहिए और यह प्रश्न पूछना चाहिए: डेटा जीवन में क्या मूल्य लाएगा?

अब तक, हमने विभिन्न उद्योगों और क्षेत्रों के लिए विभिन्न प्रकार के उत्पादों और समाधानों पर शोध और विकास किया है, विशेष रूप से ViGPT, VinDr - चिकित्सा इमेजिंग निदान में AI समाधान प्रदान करना, VinBase - एक जैव-कृत्रिम बुद्धिमत्ता मंच, या Vizone - स्मार्ट छवि विश्लेषण समाधानों का एक सेट।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 5.

विन्ग्रुप कॉर्पोरेशन के एक कार्यक्रम में विन्बिगडाटा के प्रमुख कर्मचारियों के साथ

चौथी औद्योगिक क्रांति वैश्विक स्तर पर ज़ोरदार तरीके से हो रही है। आपके विचार से वियतनाम को क्या लाभ हैं?

पिछली क्रांतियों की तुलना में, मेरा मानना ​​है कि वियतनाम के पास इस 4.0 औद्योगिक क्रांति में आगे बढ़ने के लिए कई फ़ायदे हैं, जिससे विश्व मानचित्र पर देश की स्थिति बेहतर हो सकती है। इस लक्ष्य को प्राप्त करने की दो कुंजियाँ हैं: आँकड़े और लोग।

वियतनाम की वर्तमान जनसंख्या लगभग 10 करोड़ है, जिनमें से युवाओं का एक बड़ा हिस्सा फ़ोन और पर्सनल कंप्यूटर का इस्तेमाल करता है। इसके अलावा, हमारे पास कृत्रिम बुद्धिमत्ता के प्रतिष्ठित विशेषज्ञ और सूचना प्रौद्योगिकी के क्षेत्र में उच्च-गुणवत्ता वाले युवा कर्मचारी हैं, और गणित में हमारी पकड़ बहुत मज़बूत है।

तो फिर सीमाएं क्या हैं?

पहली स्पष्ट सीमा यह है कि बड़ी आबादी होने के बावजूद, हमें अभी भी डेटा पर नियंत्रण रखने में कठिनाई हो रही है, विशेष रूप से सुविधाओं, व्यावसायिक इकाइयों और प्रशासनों में डेटा को मानकीकृत और समकालिक बनाने में।

इसके अलावा, हमें अन्य बाधाओं का भी सामना करना पड़ रहा है, जैसे सीमित निवेश संसाधन, विशेष रूप से उच्च प्रदर्शन कंप्यूटिंग अवसंरचना में निवेश।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 6.

आपकी राय में, वियतनामी लोगों के जीवन को बेहतर बनाने के लिए प्रौद्योगिकी के निर्माण और उसमें महारत हासिल करने की यात्रा में वियतनामी डेटा निपुणता की भूमिका कितनी महत्वपूर्ण है?

वर्तमान में दुनिया भर में कई अग्रणी कृत्रिम बुद्धिमत्ता उत्पाद मौजूद हैं, जिनमें आमतौर पर ओपनएआई से चैटजीपीटी या गूगल से बार्ड जैसे बड़े भाषा मॉडल पर आधारित जनरेटिव एआई अनुप्रयोग उत्पाद शामिल हैं। हालाँकि, इन उत्पादों के विकास के लिए वियतनामी मुख्य भाषा समूह नहीं है।

इसलिए, उपयोगकर्ताओं को लौटाई गई वियतनामी-विशिष्ट सामग्री की गुणवत्ता कमोबेश प्रभावित होती है और इसमें त्रुटियों की उच्च संभावना होती है, अधिक खतरनाक रूप से, बुनियादी ज्ञान में त्रुटियां होती हैं।

वियतनामी होने के नाते, हमें अपने स्वयं के डेटा स्रोतों तक पहुँच का लाभ प्राप्त है। केवल हमारे पास ही वियतनामी डेटा की विशेषताओं, वियतनामी लोगों की ज़रूरतों और विशेषताओं को समझने की क्षमता है। इसलिए, वियतनामी डेटा में महारत हासिल करना वास्तव में मुख्य तकनीकों में महारत हासिल करने की कुंजी है, जो कि वियतनामी लोगों की सेवा करने वाली तकनीकें हैं।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 7.

VinBigdata सदस्यों के लिए आंतरिक प्रशिक्षण

विशिष्ट डेटा स्रोतों तक कैसे पहुंच बनाई जाए, विशेषकर तब जब अधिकांश वियतनामी लोग विदेशों से सोशल नेटवर्किंग साइटों का उपयोग करते हैं?

वास्तविकता यह है कि आज मानव डेटा का सबसे बड़ा स्रोत (केवल वियतनामी ही नहीं) इंटरनेट और सोशल नेटवर्क पर है। हालाँकि, हम वियतनामी डेटा की विशेषताओं की समझ के आधार पर, प्रत्येक परियोजना द्वारा निर्धारित विशेषताओं के आधार पर, विभिन्न स्रोतों से डेटा तक पहुँच और संग्रह कर सकते हैं।

उदाहरण के लिए, OpenAI के GPT मॉडल में सैकड़ों, यहाँ तक कि खरबों पैरामीटर होते हैं, जिन्हें भारी मात्रा में डेटा पर प्रशिक्षित किया जाता है, और इनकी लागत अरबों डॉलर होती है। इनकी तुलना में, हमने अपने शोध, क्षमताओं और संसाधनों के आधार पर एक बिल्कुल अलग रास्ता चुना है: केवल कुछ अरब पैरामीटरों की वास्तुकला वाला एक वियतनामी भाषा मॉडल बनाना, जिसे 600 जीबी के वियतनामी डेटा सेट पर प्रशिक्षित किया गया है जिसे हमने स्वयं एकत्रित और परिष्कृत किया है, लेकिन वियतनामी प्रसंस्करण के संदर्भ में समान क्षमताओं के साथ। परिणाम बताते हैं कि हमारा स्व-विकसित आर्किटेक्चर स्वयं को अनुकूलित कर सकता है, भाषा मॉडल प्रशिक्षण समय को कम कर सकता है, लागत कम कर सकता है, और फिर भी मॉडल की गुणवत्ता सुनिश्चित कर सकता है।

कृत्रिम बुद्धिमत्ता उत्पादों पर शोध और विकास की प्रक्रिया में आपको और आपकी टीम को किन चुनौतियों का सामना करना पड़ा है?

पहली चुनौती निश्चित रूप से समय की है। कृत्रिम बुद्धिमत्ता तकनीक की लहर बहुत तेज़ी से आ रही है और विस्फोट के दौर में है। दुनिया भर की अग्रणी तकनीकी कंपनियों ने अत्यधिक पूर्ण, निरंतर अद्यतन और उन्नत उत्पाद तेज़ी से लॉन्च किए हैं। अगर हम धीमे रहे और समय पर उत्पाद लॉन्च नहीं किए, तो हम निश्चित रूप से पिछड़ जाएँगे।

दूसरी ओर, यदि हम ऐसे उत्पाद बनाना चाहते हैं जिन्हें लागू किया जा सके और जो व्यावहारिक सामाजिक समस्याओं को हल कर सकें, तो हमें उत्पाद की उत्कृष्ट, विशेष और अनूठी विशेषताओं को खोजने और विकसित करने पर भी विचार करना चाहिए।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 8.

वियतनाम आर्टिफिशियल इंटेलिजेंस दिवस (AI4VN 2023) पर प्रस्तुति

दरअसल, वियतनाम और दुनिया भर में कई व्यक्तियों और संगठनों को डेटा लीक के कारण भारी नुकसान हुआ है। आप डेटा सुरक्षा के मुद्दे को कैसे देखते हैं?

यह कहा जा सकता है कि आज कोई भी अनुप्रयोग डेटा से ही आता है। डेटा के साथ काम करते समय, एक ओर, हमें जीवन के लिए सर्वोत्तम तकनीक बनाने के लिए डेटा का उपयोग करने का लक्ष्य सुनिश्चित करना चाहिए, और दूसरी ओर, हमें व्यक्तियों और संगठनों के लिए डेटा सुरक्षा सुनिश्चित करनी चाहिए।

डेटा सुरक्षा आश्वासन प्रक्रिया में मानवीय पहलू एक अत्यंत महत्वपूर्ण कड़ी है। इनमें डेवलपर, उत्पाद उपयोगकर्ता और उपयोगकर्ता शामिल हैं। डेवलपर्स के लिए, डेटा संग्रह और प्रसंस्करण की शुरुआत से ही डेटा सुरक्षा के बारे में जागरूकता मौजूद होनी चाहिए।

अक्सर, जब कोई समस्या नहीं होती, तो हम डेटा सुरक्षा के महत्व से अनजान होते हैं। लेकिन अगर डेटा लीक हो जाए, तो नुकसान बहुत बड़ा हो सकता है। डेटा लीक तकनीकी समस्याओं या डेटा चोरी के लिए जानबूझकर किए गए हमलों के कारण हो सकता है। जब डेटा लीक होता है, तो व्यक्तियों या संगठनों की जानकारी का इस्तेमाल गलत लोगों द्वारा अवैध उद्देश्यों के लिए किया जा सकता है, और व्यवसायों को संबंधित समस्याओं को ठीक करने के लिए वित्तीय नुकसान उठाना पड़ सकता है, यहाँ तक कि उनके ब्रांड को भी नुकसान हो सकता है।

TS Đào Đức Minh: 'Làm chủ dữ liệu Việt là bước đầu phát triển và nắm giữ công nghệ Việt'- Ảnh 9.

डॉ. दाओ डुक मिन्ह और विनबिगडाटा टीम एक कार्यक्रम में

वियतनामी लोगों की सेवा करने के लिए प्रौद्योगिकी में महारत हासिल करने की आकांक्षा के बाद, क्या विश्व में आगे बढ़ने के लिए कदम उठाए जाएंगे?

कोई भी संगठन या व्यवसाय जो अपने उत्पादों को अंतर्राष्ट्रीय बाज़ार में लाना चाहता है, उसे अंतर्राष्ट्रीय मानकों का पालन करना होगा। VinBigdata के पास समाधानों और तकनीक में मज़बूती है, इसलिए दुनिया पर विजय पाने का लक्ष्य निर्धारित करना स्वाभाविक है।

बेशक, कई अलग-अलग उत्पादों और अनुप्रयोगों के लिए तैनाती के लिए, दुनिया भर के उपयोगकर्ताओं के कई वर्षों के अनुभव और समझ के साथ अंतर्राष्ट्रीय इकाइयों का समर्थन होना आवश्यक है।

धन्यवाद!


[विज्ञापन_2]
स्रोत: https://thanhnien.vn/ts-dao-duc-minh-lam-chu-du-lieu-viet-la-buoc-dau-phat-trien-va-nam-giu-cong-nghe-viet-18524052710263732.htm

टिप्पणी (0)

No data
No data

उसी विषय में

उसी श्रेणी में

किलो 636 पनडुब्बी कितनी आधुनिक है?
पैनोरमा: 2 सितंबर की सुबह परेड, A80 मार्च का विशेष लाइव एंगल से दृश्य
2 सितंबर को राष्ट्रीय दिवस मनाने के लिए हनोई आतिशबाजी से जगमगा उठा
समुद्री परेड में भाग लेने वाला Ka-28 पनडुब्बी रोधी हेलीकॉप्टर कितना आधुनिक है?

उसी लेखक की

विरासत

आकृति

व्यापार

No videos available

समाचार

राजनीतिक प्रणाली

स्थानीय

उत्पाद