Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

'मेक इन वियतनाम' कोर एआई को दुनिया में शीर्ष 12 में स्थान मिला

रोबस्ट रीडिंग कॉम्पिटिशन (आरआरसी - दुनिया में एक प्रतिष्ठित वैज्ञानिक खेल का मैदान) के मूल्यांकन के अनुसार, CATI-VLM छवि पाठ पहचान मॉडल, एक "वियतनाम में निर्मित" उत्पाद, दुनिया में शीर्ष 12 में स्थान पर है।

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp03/07/2025



वियतनाम में डिजिटल परिवर्तन और कृत्रिम बुद्धिमत्ता (एआई) परिवर्तन के संदर्भ में, ओसीआर तकनीक (ऑप्टिकल कैरेक्टर रिकग्निशन) दस्तावेज़ों के डिजिटलीकरण, व्यावसायिक प्रक्रियाओं के स्वचालन, लागत बचत और प्रबंधन दक्षता में सुधार में एक महत्वपूर्ण भूमिका निभा रही है। हालाँकि, वियतनामी लोगों की उच्चारण और लिखावट की विशेषताओं के कारण, पहचान की समस्या केवल 'शब्दों को पढ़ने' तक ही सीमित नहीं है, बल्कि इसके लिए मॉडल में संदर्भ को व्यापक रूप से समझने की क्षमता होना आवश्यक है।

हाल ही में, सीएमसी टेक्नोलॉजी एप्लीकेशन इंस्टीट्यूट (सीएमसी एटीआई) ने 5 टीबी बड़े डेटा वेयरहाउस से अनुसंधान टीम द्वारा विकसित सीएटीआई-वीएलएम (विजुअल डॉक्यूमेंट अंडरस्टैंडिंग) मॉडल की घोषणा की, जो डॉक्यूमेंट विजुअल क्वेश्चन आंसरिंग (डॉकवीक्यूए) श्रेणी में जून 2025 में रोबस्ट रीडिंग कॉम्पिटिशन (आरआरसी) द्वारा घोषित रैंकिंग में दुनिया में शीर्ष 12 और वियतनाम में शीर्ष 1 पर पहुंच गया।

चित्र परिचय

DocVQA श्रेणी 6/2025 में आरआरसी रैंकिंग।

रोबस्ट रीडिंग कॉम्पिटिशन (RRC) एक प्रतिष्ठित वैज्ञानिक मंच है (https://rrc.cvc.uab.es/), जिसका आयोजन स्पेन के बार्सिलोना ऑटोनोमा विश्वविद्यालय (UAB) के कंप्यूटर विज़न सेंटर (CVC) द्वारा किया जाता है, जो कंप्यूटर विज़न के क्षेत्र में दुनिया का एक प्रतिष्ठित शोध संस्थान है। 2011 में शुरू हुई यह प्रतियोगिता, जो हमेशा दस्तावेज़ विश्लेषण और कंप्यूटर विज़न पर दुनिया के सबसे बड़े मंचों में से एक, टेक्स्ट एनालिसिस एंड रिकॉग्निशन (ICDAR) पर अंतर्राष्ट्रीय सम्मेलन के साथ होती है, एक महत्वपूर्ण आयोजन बन गई है, जो प्रतिष्ठित विश्वविद्यालयों, शोध संस्थानों और सिंघुआ विश्वविद्यालय, हुंडई मोटर ग्रुप और टेनसेंट जैसी प्रौद्योगिकी कंपनियों के शोधकर्ताओं और इंजीनियरों को आकर्षित करती है... RRC के कार्य तकनीकी प्रगति को बढ़ावा देने के लिए डिज़ाइन किए गए हैं, जो अनुवाद, उद्यम डेटा प्रबंधन से लेकर शहरी विश्लेषण और ऐतिहासिक दस्तावेज़ प्रसंस्करण तक की व्यावहारिक समस्याओं से निकटता से जुड़े हैं।

सीएमसी एटीआई के निदेशक डॉ. डांग मिन्ह तुआन ने कहा: "सीएमसी टीम की शोध क्षमता आरआरसी जैसे प्रतिष्ठित वैश्विक मंच के माध्यम से प्रमाणित होती है। हमें गर्व है कि कम समय में ही, टीम विकसित देशों के बड़े नामों के साथ कंधे से कंधा मिलाकर एक उच्च रैंकिंग प्राप्त कर सकती है। इससे भी महत्वपूर्ण बात यह है कि यह वियतनामी लोगों की विशिष्ट समस्याओं और वियतनाम के विशिष्ट क्षेत्रों के समाधान हेतु प्रौद्योगिकी में निपुणता प्राप्त करने की क्षमता का स्पष्ट प्रदर्शन है।"


CATI-VLM पारंपरिक OCR से इस मायने में अलग है कि यह न केवल वर्णों को निकालता है, बल्कि सूचना की कई परतों को भी समझता है: पाठ सामग्री, गैर-पाठ तत्व (टिक बॉक्स, चेक बॉक्स, चार्ट, हस्ताक्षर, सूत्र), लेआउट (पृष्ठ संरचना, तालिकाएँ, फ़ॉर्म) और शैली (फ़ॉन्ट, हाइलाइट, आदि)। यह मॉडल, ChatGPT की तरह, दस्तावेज़ छवियों पर दिए गए दृश्य प्रश्नों का उत्तर दे सकता है, बिना किसी विशिष्ट फ़ॉर्म को पहले से सीखे।



न्यूज एंड पीपल न्यूजपेपर के अनुसार

स्रोत: https://doanhnghiepvn.vn/cong-nghe/ai-loi-make-in-vietnam-duoc-xep-hang-top-12-the-gioi/20250703100726051


टिप्पणी (0)

No data
No data

उसी विषय में

उसी श्रेणी में

Su 30-MK2 लड़ाकू विमानों ने जैमिंग गोले गिराए, हेलीकॉप्टरों ने राजधानी के आकाश में झंडे फहराए
राजधानी के आसमान में चमकता हुआ हीट ट्रैप छोड़ते हुए Su-30MK2 लड़ाकू विमान को देखने का आनंद लीजिए
(लाइव) 2 सितंबर को राष्ट्रीय दिवस मनाने के लिए समारोह, परेड और मार्च का सामान्य पूर्वाभ्यास
डुओंग होआंग येन ने एकेपेला "फादरलैंड इन द सनलाइट" गाकर गहरी भावनाएं जगाईं

उसी लेखक की

विरासत

आकृति

व्यापार

No videos available

समाचार

राजनीतिक प्रणाली

स्थानीय

उत्पाद