នៅក្នុងបរិបទនៃការផ្លាស់ប្តូរឌីជីថល និងការផ្លាស់ប្តូរកម្មវិធីបញ្ញាសិប្បនិម្មិតនៅក្នុងប្រទេសវៀតណាម បច្ចេកវិទ្យា OCR (Optical Character Recognition) ដើរតួនាទីយ៉ាងសំខាន់កាន់តែខ្លាំងឡើងក្នុងការរៀបចំឯកសារឌីជីថល ស្វ័យប្រវត្តិកម្មដំណើរការអាជីវកម្ម សន្សំការចំណាយ និងបង្កើនប្រសិទ្ធភាពការគ្រប់គ្រង។ ទោះបីជាយ៉ាងណាក៏ដោយ ជាមួយនឹងលក្ខណៈរបស់ជនជាតិវៀតណាមដែលមានការបញ្ចេញសំឡេង និងការសរសេរដោយដៃ បញ្ហាការទទួលស្គាល់មិនឈប់ត្រឹម 'ការអានពាក្យ' នោះទេ ប៉ុន្តែទាមទារឱ្យគំរូមានសមត្ថភាពក្នុងការយល់អំពីបរិបទឱ្យបានទូលំទូលាយ។
ថ្មីៗនេះ វិទ្យាស្ថានកម្មវិធីបច្ចេកវិទ្យា CMC (CMC ATI) បានប្រកាសអំពីគំរូ CATI-VLM (Visual Document Understanding) ដែលបង្កើតឡើងដោយក្រុមស្រាវជ្រាវពីឃ្លាំងទិន្នន័យធំ 5TB ដោយវ៉ាដាច់ដៃគូប្រកួតប្រជែងអន្តរជាតិជាច្រើនដើម្បីឈានដល់ចំណាត់ថ្នាក់កំពូលទាំង 12 នៅលើពិភពលោក និងលេខ 1 នៅប្រទេសវៀតណាមក្នុងចំណាត់ថ្នាក់ដែលទើបតែប្រកាសដោយការប្រកួតប្រជែងអានដ៏រឹងមាំ (RRC) ក្នុងខែមិថុនា ឆ្នាំ 2025 (Quocusa) ប្រភេទ។
ការប្រកួតប្រជែងការអានដ៏រឹងមាំ (RRC) គឺជាកន្លែងលេង បែបវិទ្យាសាស្ត្រ ដ៏មានកិត្យានុភាព (https://rrc.cvc.uab.es/) ដែលរៀបចំដោយមជ្ឈមណ្ឌលចក្ខុវិស័យកុំព្យូទ័រ (CVC) នៃសាកលវិទ្យាល័យអូតូណូម៉ាដឺបាសេឡូណា (UAB) អេស្បាញ ដែលជាកន្លែងស្រាវជ្រាវដ៏មានកិត្យានុភាពនៅលើពិភពលោកក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។
ការប្រកួតប្រជែងនេះត្រូវបានផ្តួចផ្តើមនៅក្នុងឆ្នាំ 2011 ហើយត្រូវបានប្រារព្ធឡើងជារៀងរាល់ឆ្នាំក្នុងក្របខ័ណ្ឌនៃសន្និសីទអន្តរជាតិស្តីពីការវិភាគ និងការទទួលស្គាល់អត្ថបទ (ICDAR) ដែលជាវេទិកាឈានមុខគេមួយ របស់ពិភពលោក ក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។ ការប្រកួតប្រជែងទាក់ទាញអ្នកស្រាវជ្រាវ និងវិស្វករមួយចំនួនធំមកពីសាកលវិទ្យាល័យ វិទ្យាស្ថានស្រាវជ្រាវ និងសាជីវកម្មបច្ចេកវិទ្យាធំៗ ដូចជាសាកលវិទ្យាល័យ Tsinghua ក្រុមហ៊ុន Hyundai Motor Group ក្រុមហ៊ុន Tencent ជាដើម។ បញ្ហារបស់ RRC ត្រូវបានរចនាឡើងដើម្បីលើកកម្ពស់វឌ្ឍនភាពបច្ចេកវិទ្យា ភ្ជាប់យ៉ាងជិតស្និទ្ធទៅនឹងបញ្ហាជាក់ស្តែងពីការបកប្រែ ការគ្រប់គ្រងទិន្នន័យសហគ្រាស រហូតដល់ការវិភាគទីក្រុង និងដំណើរការឯកសារប្រវត្តិសាស្ត្រ។
លោកបណ្ឌិត Dang Minh Tuan នាយក CMC ATI បានចែករំលែកថា៖ "យើងមានសេចក្តីសោមនស្សរីករាយណាស់ដែលសមត្ថភាពស្រាវជ្រាវរបស់ក្រុម CMC ត្រូវបានបញ្ជាក់តាមរយៈសួនកុមារពិភពលោកដ៏មានកិត្យានុភាពដូចជា RRC ។ ក្នុងរយៈពេលដ៏ខ្លី ក្រុមស្រាវជ្រាវទទួលបានចំណាត់ថ្នាក់ខ្ពស់ បង្ហាញពីការប្រកួតប្រជែងជាអន្តរជាតិជាមួយនឹងប្រទេសអភិវឌ្ឍន៍ធំៗ។

CATI-VLM ខុសពី OCR ប្រពៃណី ដោយវាមិនត្រឹមតែស្រង់តួអក្សរប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏យល់អំពីស្រទាប់ជាច្រើននៃព័ត៌មានផងដែរ៖ ខ្លឹមសារអត្ថបទ ធាតុដែលមិនមែនជាអត្ថបទ (ប្រអប់ធីក ប្រអប់ធីក គំនូសតាង ហត្ថលេខា រូបមន្ត) ប្លង់ (រចនាសម្ព័ន្ធទំព័រ តារាង ទម្រង់) និងរចនាប័ទ្ម (ពុម្ពអក្សរ គំនួសពណ៌។ល។)។ គំរូអាចឆ្លើយសំណួរដែលមើលឃើញនៅលើរូបភាពឯកសារស្រដៀងទៅនឹង ChatGPT ដោយមិនចាំបាច់សិក្សាទម្រង់ជាក់លាក់ជាមុន។
គួរកត់សម្គាល់ថានៅលើចំណាត់ថ្នាក់ RRC CATI-VLM ដែលមានប៉ារ៉ាម៉ែត្រត្រឹមតែ 3 ពាន់លានទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតនៅក្នុងសំណុំទិន្នន័យ 4/7 លើសពីម៉ូដែល Big Tech ជាច្រើនដូចជា Deepseek (27 ពាន់លានប៉ារ៉ាម៉ែត្រ), GPT-4 Vision Turbo + Amazon Textract OCR (កំពូល 34) ឬ Baidu (កំពូល 22) ។
សមិទ្ធិផលនេះក៏បង្ហាញពីវិធីសាស្រ្តជាក់ស្តែង ដោយផ្តោតលើការធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាស្នូល បង្កើនប្រសិទ្ធភាពគំរូឱ្យសមស្របនឹងលក្ខខណ្ឌហេដ្ឋារចនាសម្ព័ន្ធរបស់វៀតណាម ជំនួសឱ្យការដេញតាមមាត្រដ្ឋានប៉ារ៉ាម៉ែត្រ។


លោក Nguyen Trung Chinh ប្រធានក្រុមប្រឹក្សាភិបាល ប្រធានប្រតិបត្តិនៃ CMC Technology Group បានសង្កត់ធ្ងន់ថា៖ “នេះគឺជាលទ្ធផលនៃជាងមួយទសវត្សរ៍នៃការវិនិយោគឥតឈប់ឈរក្នុងការស្រាវជ្រាវ និងអភិវឌ្ឍន៍បច្ចេកវិទ្យា (R&D)។ សមិទ្ធិផលខ្ពស់របស់ CMC នៅទីលានលេងបច្ចេកវិទ្យាអន្តរជាតិបានអះអាងនូវយុទ្ធសាស្ត្រធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាវៀតណាម រួមជាមួយនឹងការតំរង់ទិសនៃ AI Transformation បញ្ញា និងឈានចូលទីផ្សារបច្ចេកវិទ្យារបស់វៀតណាមយ៉ាងពេញទំហឹង។ ការបង្កើតទីតាំងដ៏សក្តិសមនៅលើផែនទីបច្ចេកវិជ្ជាពិភពលោក»។
CATI-VLM នឹងត្រូវបានអនុវត្តនៅក្នុងខ្សែសង្វាក់ផលិតផលនៃប្រព័ន្ធអេកូ C.OpenAI រួមមានៈ ជំនួយការនិម្មិត CLS សម្រាប់ពិនិត្យមើលឯកសារច្បាប់ CMC SmartDoc - វេទិកាបម្លែងឯកសារឌីជីថល ប្រព័ន្ធគ្រប់គ្រងចំណេះដឹង CMC KMS ប្រព័ន្ធរាយការណ៍ដោយស្វ័យប្រវត្តិសម្រាប់ការិយាល័យឆ្លាតវៃ និងកម្មវិធីឯកសារ Agentic ជំនាន់ថ្មី។
ប្រភព៖ https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html
Kommentar (0)