सुरक्षा, स्वास्थ्य सेवा , ई-कॉमर्स, व्यक्तिगत सुरक्षा जैसे कई क्षेत्रों में चेहरे की पहचान तकनीक और 3D चेहरे की मॉडलिंग के बढ़ते व्यापक उपयोग के संदर्भ में, एक संरचित, विविध और बड़े पैमाने पर चेहरे की छवि डेटाबेस बनाने की आवश्यकता अत्यंत आवश्यक होती जा रही है। आज की प्रमुख चुनौतियों में से एक यह है कि डेटा वर्गीकरण और भंडारण में सटीकता सुनिश्चित करते हुए, विभिन्न प्रकाश स्थितियों और कई शूटिंग कोणों पर, एकसमान गुणवत्ता के साथ छवि डेटा कैसे एकत्र किया जाए।
इस समस्या के समाधान के लिए, वियतनाम - कोरिया विज्ञान एवं प्रौद्योगिकी संस्थान (वीकेआईएसटी) की अनुसंधान टीम ने वीकेआईएसटी फेस कैप्चर सॉफ्टवेयर विकसित किया है, जो एक ऐसा उपकरण है जो एकाधिक डिजिटल कैमरों और प्रकाश मॉड्यूलों से युक्त प्रणाली के एक साथ नियंत्रण का समर्थन करता है, जिससे वास्तविक समय में चेहरे की छवि डेटा का संग्रह, लेबलिंग और भंडारण संभव हो पाता है।
चेहरे की छवि डेटा संग्रह और प्रसंस्करण समाधान
VKIST फेस कैप्चर को C# भाषा में प्रोग्राम किया गया है, जिसमें वियतनामी में एक अनुकूल इंटरफ़ेस है, जो एकीकृत और विस्तारित करने में आसान है।
VKIST फेस कैप्चर, USB इंटरफ़ेस और RS232 प्रोटोकॉल के ज़रिए लोकप्रिय Nikon और Canon DSLR कैमरों, जैसे 5DmarkII, 5DMarkIII, 6DMarkII, 1500D, 2000D, D60, D3000, D5100, D7100, D4, D800... को रिमोट कंट्रोल करने की सुविधा देता है। उपयोगकर्ता लाइव इमेज (लाइव व्यू) देखने, तकनीकी मापदंडों (एपर्चर, शटर स्पीड, ISO) को समायोजित करने, एक साथ फ़ोटो कैप्चर करने का निर्देश देने और वास्तविक समय में फ़ोटो को कंप्यूटर पर स्थानांतरित करने जैसे कार्य कर सकते हैं।
विशेष रूप से, यह सॉफ़्टवेयर एक साथ कई कैमरों के नियंत्रण का समर्थन करता है - जो बहु-कोणीय छवि डेटा संग्रह प्रणालियों में एक आवश्यक विशेषता है। सॉफ़्टवेयर इंटरफ़ेस वियतनामी भाषा में है, जिसे उपयोग में आसानी और जटिल प्रणालियों में आसान एकीकरण के लिए अलग-अलग कार्यात्मक ब्लॉकों में डिज़ाइन किया गया है।
VKIST फेस कैप्चर सॉफ्टवेयर इंटरफ़ेस (चित्र 1) को चित्र 2 में वर्णित कार्यों के साथ अलग-अलग ब्लॉकों में विभाजित किया गया है। सॉफ्टवेयर में प्रदर्शित भाषा वियतनामी है।
VKIST फेस कैप्चर सॉफ्टवेयर इंटरफ़ेस.
सॉफ्टवेयर के मुख्य कार्यात्मक ब्लॉकों का आरेख।
VKIST फेस कैप्चर, कॉन्फ़िगरेशन फ़ाइलों से डेटा को लाइट कंट्रोल सर्किट में ट्रांसमिट करके लाइटिंग सिस्टम की प्रकाश तीव्रता को नियंत्रित करने की क्षमता को भी एकीकृत करता है। इसकी बदौलत, शूटिंग प्रक्रिया के दौरान प्रकाश परिवेश को सटीक रूप से नियंत्रित किया जाता है, जिससे एकसमान छवि गुणवत्ता सुनिश्चित होती है, जो AI अनुप्रयोगों में एक महत्वपूर्ण कारक है।
इसके अलावा, इस सॉफ़्टवेयर में प्रकाश तीव्रता नियंत्रण फ़ंक्शन भी एकीकृत है। उपयोगकर्ताओं को केवल उपलब्ध प्रकाश तीव्रता पैरामीटर फ़ाइल दर्ज करनी होती है, फिर सॉफ़्टवेयर का उपयोग करके डेटा को पढ़ना और मापदंडों को प्रकाश तीव्रता नियंत्रण सर्किट तक पहुँचाना होता है। वहाँ से, आसपास के वातावरण में प्रकाश की मात्रा को सटीक रूप से नियंत्रित किया जा सकता है।
इसकी एक और खासियत है संरचना के अनुसार डेटा को स्वचालित रूप से लेबल करने की क्षमता, जिससे AI मॉडल के प्रबंधन, पुनर्प्राप्ति और प्रशिक्षण की प्रक्रिया और भी कुशल हो जाती है। यह सॉफ़्टवेयर डेटा संग्रहण मोड विकल्पों (कैमरे पर स्थानीय रूप से, कंप्यूटर में सहेजा गया) और पूर्व-निर्धारित परिदृश्यों के अनुसार डेटा वर्गीकरण का समर्थन करता है।
एक और बेहतरीन विशेषता छवियों को पूर्वनिर्धारित संरचना के अनुसार स्वचालित रूप से लेबल करने की क्षमता है, जिससे मैन्युअल वर्गीकरण समय की काफी बचत होती है। VKIST फेस कैप्चर छवियों को सहेजने के तरीके को कॉन्फ़िगर करने की सुविधा देता है: फ़ोल्डर के अनुसार, वस्तु के अनुसार, भाव-भंगिमाओं के प्रकार के अनुसार, या अन्य विविधताओं जैसे चश्मा पहनना, मास्क पहनना, हेयरस्टाइल बदलना...
इसके अलावा, यह सॉफ़्टवेयर कई डेटा सेविंग मोड्स को भी सपोर्ट करता है - जिसमें क्रमिक रिकॉर्डिंग, ओवरराइटिंग या सर्वर पर ट्रांसफर करने से पहले कैमरे में सेव करना शामिल है। इससे सिस्टम को बड़ी मात्रा में इमेजेस को संभालने में लचीलापन मिलता है, जिससे ऑपरेशन के दौरान डेटा लॉस या रुकावटों का जोखिम कम होता है।
कृत्रिम बुद्धिमत्ता अनुसंधान मंच और बड़े पैमाने पर चेहरे का डेटाबेस निर्माण
इस सॉफ़्टवेयर का उपयोग वर्तमान में VKIST द्वारा स्थापित चेहरे की छवि डेटा संग्रह प्रणाली में किया जा रहा है, जिसमें 33 कैनन DSLR कैमरे, 20 समायोज्य प्रकाश मॉड्यूल, एक गोलार्ध के चारों ओर कैमरे और प्रकाश व्यवस्था स्थापित करने के लिए एक लोहे का फ्रेम, और मॉनिटर और सिस्टम नियंत्रण सॉफ़्टवेयर वाले तीन शक्तिशाली पीसी शामिल हैं। इस प्रणाली के साथ, VKIST-Nacentech संयुक्त प्रयोगशाला/सूचना प्रौद्योगिकी विभाग, VKIST लगभग 500 लोगों (लगभग 5 मिलियन फ़ोटो) की चेहरे की छवि का डेटाबेस एकत्रित और निर्मित कर रहा है और आगे भी डेटा एकत्र करना जारी रखे हुए है।
बहु-कोणीय चेहरे की छवि डेटा नमूना VKIST फेस कैप्चर सॉफ्टवेयर द्वारा किया गया था।
इस सॉफ़्टवेयर का इस्तेमाल कोरिया विज्ञान एवं प्रौद्योगिकी संस्थान (KIST) के साथ मिलकर 1,000 से ज़्यादा वियतनामी लोगों के चेहरे की छवियों का डेटा इकट्ठा करने के लिए किया गया है। इस डेटाबेस में अलग-अलग प्रकाश स्थितियों में सामान्य, खुश, उदास, डरे हुए, क्रोधित, हैरान, परेशान जैसे विभिन्न चेहरे के भावों और मास्क, चश्मा, टोपी, विग जैसी अस्पष्ट चीज़ों वाली लगभग 1 करोड़ तस्वीरें शामिल हैं।
पूर्ण विनिर्देशों के साथ सॉफ्टवेयर इंटरफ़ेस.
वीकेआईएसटी फेस कैप्चर सॉफ्टवेयर का उपयोग करके सिस्टम से एकत्रित डेटा का उपयोग अनुसंधान और प्रौद्योगिकी विकास की कई दिशाओं में किया जा रहा है:
बहु-कोणीय 2D फ़ोटो से 3D चेहरा मॉडलिंग,
विकृत परिस्थितियों (अस्पष्टता, जटिल प्रकाश) में चेहरे की पहचान तकनीक की सटीकता में वृद्धि,
स्मृति चिन्ह के रूप में कांच पर चेहरों की 3डी लेजर उत्कीर्णन,
पुरानी तस्वीरों से मृत लोगों के चेहरों की छवियों का पुनर्निर्माण, सांस्कृतिक और विरासत अभिलेखीय उद्देश्यों की पूर्ति,
ई-कॉमर्स, चिकित्सा सौंदर्यशास्त्र, संवर्धित वास्तविकता में अनुप्रयोग।
वीकेआईएसटी फेस कैप्चर का विकास और अनुप्रयोग न केवल वीकेआईएसटी को बड़े डेटाबेस बनाने में पहल करने में मदद करता है, बल्कि वियतनाम में कंप्यूटर विज़न और कृत्रिम बुद्धिमत्ता पर अनुसंधान क्षमता में सुधार करने में भी योगदान देता है - जो चौथी औद्योगिक क्रांति के प्रमुख क्षेत्र हैं।
विशेष हार्डवेयर प्रणालियों - विशेष रूप से मल्टी-डिवाइस ऑप्टिकल प्रणालियों - को नियंत्रित करने के लिए सॉफ्टवेयर प्रौद्योगिकी में महारत हासिल करना वियतनामी लोगों की मानवशास्त्रीय विशेषताओं के लिए उपयुक्त घरेलू एआई प्लेटफार्मों के निर्माण में महत्वपूर्ण भूमिका निभाता है।
वीकेआईएसटी फेस कैप्चर वियतनाम में कंप्यूटर विज़न सिस्टम के अनुसंधान और परिनियोजन के लिए उच्च-तकनीकी सॉफ़्टवेयर उपकरणों के विकास का एक प्रदर्शन है। बड़े पैमाने पर छवि डेटा संग्रह प्रणालियों को नियंत्रित और समकालिक करने की तकनीक में महारत हासिल करना देश में कृत्रिम बुद्धिमत्ता विकसित करने की क्षमता को बढ़ावा देने में एक महत्वपूर्ण आधार होगा, खासकर उन क्षेत्रों में जहाँ क्षेत्रीय या नृवंशविज्ञान संबंधी विशेषताओं वाले मानवमितीय डेटा की आवश्यकता होती है।
आईटी विभाग ने संपूर्ण कार्यक्रम को पूरा करने और परीक्षण करने के तुरंत बाद "वीकेआईएसटी फेस कैप्चर" सॉफ्टवेयर का कॉपीराइट पंजीकृत कर लिया।
VKIST फेस कैप्चर सॉफ्टवेयर के लिए कॉपीराइट पंजीकरण का प्रमाण पत्र।
स्रोत: https://mst.gov.vn/vkist-face-capture-phan-mem-thu-thap-du-lieu-anh-khuon-mat-da-goc-phuc-vu-nghien-cuu-va-phat-trien-ai-197250927011551324.htm
टिप्पणी (0)