वियतनाम में एआई परिवर्तन ज़ोरदार तरीके से हो रहा है, और दस्तावेज़ डिजिटलीकरण में ओसीआर (ऑप्टिकल कैरेक्टर रिकग्निशन) तकनीक तेज़ी से महत्वपूर्ण भूमिका निभा रही है। चित्र: चित्रण
हाल ही में, सीएमसी टेक्नोलॉजी एप्लीकेशन इंस्टीट्यूट (सीएमसी एटीआई) ने 5 टीबी बड़े डेटा वेयरहाउस से अनुसंधान टीम द्वारा विकसित सीएटीआई-वीएलएम (विजुअल डॉक्यूमेंट अंडरस्टैंडिंग) मॉडल की घोषणा की, जो डॉक्यूमेंट विजुअल क्वेश्चन आंसरिंग (डॉकवीक्यूए) श्रेणी में जून 2025 में रोबस्ट रीडिंग कॉम्पिटिशन (आरआरसी) द्वारा घोषित रैंकिंग में दुनिया में शीर्ष 12 और वियतनाम में शीर्ष 1 पर पहुंच गया।
सीएमसी एटीआई के निदेशक श्री डांग मिन्ह तुआन ने कहा: "हमें बेहद खुशी है कि सीएमसी टीम की शोध क्षमता को आरआरसी जैसे प्रतिष्ठित वैश्विक मंच के माध्यम से मान्यता मिली है। हमें गर्व है कि इतने कम समय में ही, टीम विकसित देशों के बड़े नामों के साथ कंधे से कंधा मिलाकर खड़ी होकर उच्च रैंकिंग हासिल कर सकती है। इससे भी महत्वपूर्ण बात यह है कि यह वियतनामी और वियतनाम के विशिष्ट क्षेत्रों की विशिष्ट समस्याओं को हल करने के लिए प्रौद्योगिकी में महारत हासिल करने की क्षमता का स्पष्ट प्रदर्शन है।"
वियतनाम में डिजिटल परिवर्तन और एआई परिवर्तन के संदर्भ में, ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) तकनीक दस्तावेजों को डिजिटल बनाने, व्यावसायिक प्रक्रियाओं को स्वचालित करने, लागत बचाने और प्रबंधन दक्षता में सुधार करने में तेजी से महत्वपूर्ण भूमिका निभा रही है।
हालांकि, उच्चारण और लिखावट के साथ वियतनामी की विशेषताओं के साथ, पहचान की समस्या 'शब्दों को पढ़ने' तक ही सीमित नहीं है, बल्कि इसके लिए मॉडल में संदर्भ को व्यापक रूप से समझने की क्षमता की आवश्यकता होती है।
CATI-VLM पारंपरिक OCR से इस मायने में भिन्न है कि यह न केवल वर्णों को निकालता है, बल्कि सूचना की कई परतों को भी समझता है: पाठ सामग्री, गैर-पाठ तत्व (टिक बॉक्स, चेकबॉक्स, चार्ट, हस्ताक्षर, सूत्र), लेआउट (पृष्ठ संरचना, तालिकाएं, प्रपत्र) और शैली (फ़ॉन्ट, हाइलाइट्स...)।
यह मॉडल, चैटजीपीटी के समान, दस्तावेज़ छवियों पर प्रस्तुत दृश्य प्रश्नों का उत्तर दे सकता है, तथा इसके लिए पहले से विशिष्ट प्रारूप सीखने की आवश्यकता नहीं होती।
रोबस्ट रीडिंग कॉम्पिटिशन (आरआरसी) एक प्रतिष्ठित वैज्ञानिक खेल का मैदान है, जिसका आयोजन यूनिवर्सिटैट ऑटोनोमा डी बार्सिलोना (यूएबी) स्पेन के कंप्यूटर विजन सेंटर द्वारा किया जाता है, जो कंप्यूटर विजन के क्षेत्र में दुनिया में एक प्रतिष्ठित अनुसंधान सुविधा है।
2011 में शुरू की गई यह प्रतियोगिता, जो हमेशा पाठ विश्लेषण और पहचान पर अंतर्राष्ट्रीय सम्मेलन (ICDAR) के साथ होती है - दस्तावेज़ विश्लेषण और कंप्यूटर विज़न पर दुनिया के सबसे बड़े मंचों में से एक, एक महत्वपूर्ण आयोजन बन गई है, जो प्रतिष्ठित विश्वविद्यालयों, अनुसंधान संस्थानों और प्रौद्योगिकी कंपनियों जैसे कि सिंघुआ विश्वविद्यालय, हुंडई मोटर समूह और टेनसेंट के शोधकर्ताओं, इंजीनियरों को आकर्षित करती है...
आरआरसी के मिशन तकनीकी उन्नति को बढ़ावा देने के लिए डिज़ाइन किए गए हैं, जो अनुवाद और उद्यम डेटा प्रबंधन से लेकर शहरी विश्लेषण और ऐतिहासिक दस्तावेज़ प्रसंस्करण तक वास्तविक दुनिया की समस्याओं पर आधारित हैं।
काम से लेकर पालन-पोषण तक: तकनीकी सीईओ हर दिन एआई का उपयोग कैसे करते हैंजेन्सन हुआंग से लेकर टिम कुक तक, दुनिया के सबसे शक्तिशाली तकनीकी सीईओ अपने दैनिक जीवन में एआई का लाभ उठा रहे हैं।
स्रोत: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
टिप्पणी (0)