Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC ឈានដល់លំដាប់កំពូលទាំង 12 របស់ពិភពលោកក្នុងការទទួលស្គាល់អត្ថបទ

គំរូ CATI-VLM (Visual Document Understanding) ដែលបង្កើតឡើងដោយ CMC Technology Application Institute (CMC ATI) បានវ៉ាដាច់ដៃគូប្រកួតប្រជែងអន្តរជាតិជាច្រើន ដើម្បីឈានដល់ចំណាត់ថ្នាក់កំពូលទាំង 12 នៅលើពិភពលោក និងកំពូលលេខ 1 នៅវៀតណាមក្នុងចំណាត់ថ្នាក់ដែលទើបប្រកាសដោយការប្រកួតប្រជែងការអានដ៏រឹងមាំ (RRC) ក្នុងខែមិថុនា ឆ្នាំ 2025 ក្នុងប្រភេទ Document Visual Question Answering (DocVQA)។

Báo Nhân dânBáo Nhân dân02/07/2025

ចំណាត់ថ្នាក់ RRC នៅក្នុងប្រភេទ DocVQA 6/2025 ។
ចំណាត់ថ្នាក់ RRC នៅក្នុងប្រភេទ DocVQA 6/2025 ។

នៅក្នុងបរិបទនៃការផ្លាស់ប្តូរឌីជីថល និងការផ្លាស់ប្តូរកម្មវិធីបញ្ញាសិប្បនិម្មិតនៅក្នុងប្រទេសវៀតណាម បច្ចេកវិទ្យា OCR (Optical Character Recognition) ដើរតួនាទីយ៉ាងសំខាន់កាន់តែខ្លាំងឡើងក្នុងការរៀបចំឯកសារឌីជីថល ស្វ័យប្រវត្តិកម្មដំណើរការអាជីវកម្ម សន្សំការចំណាយ និងបង្កើនប្រសិទ្ធភាពការគ្រប់គ្រង។ ទោះបីជាយ៉ាងណាក៏ដោយ ជាមួយនឹងលក្ខណៈរបស់ជនជាតិវៀតណាមដែលមានការបញ្ចេញសំឡេង និងការសរសេរដោយដៃ បញ្ហាការទទួលស្គាល់មិនឈប់ត្រឹម 'ការអានពាក្យ' នោះទេ ប៉ុន្តែទាមទារឱ្យគំរូមានសមត្ថភាពក្នុងការយល់អំពីបរិបទឱ្យបានទូលំទូលាយ។

ថ្មីៗនេះ វិទ្យាស្ថានកម្មវិធីបច្ចេកវិទ្យា CMC (CMC ATI) បានប្រកាសអំពីគំរូ CATI-VLM (Visual Document Understanding) ដែលបង្កើតឡើងដោយក្រុមស្រាវជ្រាវពីឃ្លាំងទិន្នន័យធំ 5TB ដោយវ៉ាដាច់ដៃគូប្រកួតប្រជែងអន្តរជាតិជាច្រើនដើម្បីឈានដល់ចំណាត់ថ្នាក់កំពូលទាំង 12 នៅលើពិភពលោក និងលេខ 1 នៅប្រទេសវៀតណាមក្នុងចំណាត់ថ្នាក់ដែលទើបតែប្រកាសដោយការប្រកួតប្រជែងអានដ៏រឹងមាំ (RRC) ក្នុងខែមិថុនា ឆ្នាំ 2025 (Quocusa) ប្រភេទ។

ការប្រកួតប្រជែងការអានដ៏រឹងមាំ (RRC) គឺជាកន្លែងលេង បែបវិទ្យាសាស្ត្រ ដ៏មានកិត្យានុភាព (https://rrc.cvc.uab.es/) ដែលរៀបចំដោយមជ្ឈមណ្ឌលចក្ខុវិស័យកុំព្យូទ័រ (CVC) នៃសាកលវិទ្យាល័យអូតូណូម៉ាដឺបាសេឡូណា (UAB) អេស្បាញ ដែលជាកន្លែងស្រាវជ្រាវដ៏មានកិត្យានុភាពនៅលើពិភពលោកក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។

ការប្រកួតប្រជែងនេះត្រូវបានផ្តួចផ្តើមនៅក្នុងឆ្នាំ 2011 ហើយត្រូវបានប្រារព្ធឡើងជារៀងរាល់ឆ្នាំក្នុងក្របខ័ណ្ឌនៃសន្និសីទអន្តរជាតិស្តីពីការវិភាគ និងការទទួលស្គាល់អត្ថបទ (ICDAR) ដែលជាវេទិកាឈានមុខគេមួយ របស់ពិភពលោក ក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។ ការប្រកួតប្រជែងទាក់ទាញអ្នកស្រាវជ្រាវ និងវិស្វករមួយចំនួនធំមកពីសាកលវិទ្យាល័យ វិទ្យាស្ថានស្រាវជ្រាវ និងសាជីវកម្មបច្ចេកវិទ្យាធំៗ ដូចជាសាកលវិទ្យាល័យ Tsinghua ក្រុមហ៊ុន Hyundai Motor Group ក្រុមហ៊ុន Tencent ជាដើម។ បញ្ហារបស់ RRC ត្រូវបានរចនាឡើងដើម្បីលើកកម្ពស់វឌ្ឍនភាពបច្ចេកវិទ្យា ភ្ជាប់យ៉ាងជិតស្និទ្ធទៅនឹងបញ្ហាជាក់ស្តែងពីការបកប្រែ ការគ្រប់គ្រងទិន្នន័យសហគ្រាស រហូតដល់ការវិភាគទីក្រុង និងដំណើរការឯកសារប្រវត្តិសាស្ត្រ។

លោកបណ្ឌិត Dang Minh Tuan នាយក CMC ATI បានចែករំលែកថា៖ "យើងមានសេចក្តីសោមនស្សរីករាយណាស់ដែលសមត្ថភាពស្រាវជ្រាវរបស់ក្រុម CMC ត្រូវបានបញ្ជាក់តាមរយៈសួនកុមារពិភពលោកដ៏មានកិត្យានុភាពដូចជា RRC ។ ក្នុងរយៈពេលដ៏ខ្លី ក្រុមស្រាវជ្រាវទទួលបានចំណាត់ថ្នាក់ខ្ពស់ បង្ហាញពីការប្រកួតប្រជែងជាអន្តរជាតិជាមួយនឹងប្រទេសអភិវឌ្ឍន៍ធំៗ។

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
លោកបណ្ឌិត Dang Minh Tuan នាយក CMC ATI ។

CATI-VLM ខុសពី OCR ប្រពៃណី ដោយវាមិនត្រឹមតែស្រង់តួអក្សរប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏យល់អំពីស្រទាប់ជាច្រើននៃព័ត៌មានផងដែរ៖ ខ្លឹមសារអត្ថបទ ធាតុដែលមិនមែនជាអត្ថបទ (ប្រអប់ធីក ប្រអប់ធីក គំនូសតាង ហត្ថលេខា រូបមន្ត) ប្លង់ (រចនាសម្ព័ន្ធទំព័រ តារាង ទម្រង់) និងរចនាប័ទ្ម (ពុម្ពអក្សរ គំនួសពណ៌។ល។)។ គំរូអាចឆ្លើយសំណួរដែលមើលឃើញនៅលើរូបភាពឯកសារស្រដៀងទៅនឹង ChatGPT ដោយមិនចាំបាច់សិក្សាទម្រង់ជាក់លាក់ជាមុន។

គួរកត់សម្គាល់ថានៅលើចំណាត់ថ្នាក់ RRC CATI-VLM ដែលមានប៉ារ៉ាម៉ែត្រត្រឹមតែ 3 ពាន់លានទទួលបានភាពត្រឹមត្រូវខ្ពស់បំផុតនៅក្នុងសំណុំទិន្នន័យ 4/7 លើសពីម៉ូដែល Big Tech ជាច្រើនដូចជា Deepseek (27 ពាន់លានប៉ារ៉ាម៉ែត្រ), GPT-4 Vision Turbo + Amazon Textract OCR (កំពូល 34) ឬ Baidu (កំពូល 22) ។

សមិទ្ធិផលនេះក៏បង្ហាញពីវិធីសាស្រ្តជាក់ស្តែង ដោយផ្តោតលើការធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាស្នូល បង្កើនប្រសិទ្ធភាពគំរូឱ្យសមស្របនឹងលក្ខខណ្ឌហេដ្ឋារចនាសម្ព័ន្ធរបស់វៀតណាម ជំនួសឱ្យការដេញតាមមាត្រដ្ឋានប៉ារ៉ាម៉ែត្រ។

hinh-2.jpg
ទម្រង់ពាក្យសុំចូលរៀនមហាវិទ្យាល័យគំរូ
hinh-3.jpg
អត្ថបទត្រូវបានទទួលស្គាល់ពីការសរសេរដោយដៃក្នុងរូបភាពខាងលើ។

លោក Nguyen Trung Chinh ប្រធានក្រុមប្រឹក្សាភិបាល ប្រធានប្រតិបត្តិនៃ CMC Technology Group បានសង្កត់ធ្ងន់ថា៖ “នេះគឺជាលទ្ធផលនៃជាងមួយទសវត្សរ៍នៃការវិនិយោគឥតឈប់ឈរក្នុងការស្រាវជ្រាវ និងអភិវឌ្ឍន៍បច្ចេកវិទ្យា (R&D)។ សមិទ្ធិផលខ្ពស់របស់ CMC នៅទីលានលេងបច្ចេកវិទ្យាអន្តរជាតិបានអះអាងនូវយុទ្ធសាស្ត្រធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាវៀតណាម រួមជាមួយនឹងការតំរង់ទិសនៃ AI Transformation បញ្ញា និងឈានចូលទីផ្សារបច្ចេកវិទ្យារបស់វៀតណាមយ៉ាងពេញទំហឹង។ ការបង្កើតទីតាំងដ៏សក្តិសមនៅលើផែនទីបច្ចេកវិជ្ជាពិភពលោក»។

CATI-VLM នឹងត្រូវបានអនុវត្តនៅក្នុងខ្សែសង្វាក់ផលិតផលនៃប្រព័ន្ធអេកូ C.OpenAI រួមមានៈ ជំនួយការនិម្មិត CLS សម្រាប់ពិនិត្យមើលឯកសារច្បាប់ CMC SmartDoc - វេទិកាបម្លែងឯកសារឌីជីថល ប្រព័ន្ធគ្រប់គ្រងចំណេះដឹង CMC KMS ប្រព័ន្ធរាយការណ៍ដោយស្វ័យប្រវត្តិសម្រាប់ការិយាល័យឆ្លាតវៃ និងកម្មវិធីឯកសារ Agentic ជំនាន់ថ្មី។

ប្រភព៖ https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Kommentar (0)

No data
No data
មើលទីក្រុងឆ្នេរសមុទ្រ Quy Nhon នៃ Gia Lai នៅពេលយប់
រូបភាពវាលស្រែរាបស្មើនៅភូថូ ជម្រាលថ្នមៗ ភ្លឺ និងស្រស់ស្អាតដូចកញ្ចក់មុនរដូវដាំដុះ
រោងចក្រ Z121 បានត្រៀមខ្លួនរួចរាល់ហើយសម្រាប់រាត្រីចុងក្រោយនៃកាំជ្រួចអន្តរជាតិ
ទស្សនាវដ្ដីទេសចរណ៍ដ៏ល្បីល្បាញសរសើររូងភ្នំ Son Doong ថាជា "អស្ចារ្យបំផុតនៅលើភពផែនដី"
ល្អាង​អាថ៌កំបាំង​ទាក់ទាញ​ភ្ញៀវ​ទេសចរ​លោក​ខាង​លិច​ដែល​ប្រដូច​ទៅ​នឹង 'ល្អាង Phong Nha' នៅ Thanh Hoa
ស្វែងយល់ពីសម្រស់កំណាព្យនៃឆ្នេរសមុទ្រ Vinh Hy
តើតែថ្លៃបំផុតនៅទីក្រុងហាណូយ ដែលមានតម្លៃជាង ១០លានដុង/គីឡូក្រាម កែច្នៃដោយរបៀបណា?
រសជាតិនៃតំបន់ទន្លេ
ព្រះអាទិត្យរះដ៏ស្រស់ស្អាតនៅលើសមុទ្រនៃប្រទេសវៀតណាម
រូងភ្នំដ៏អស្ចារ្យនៅ Tu Lan

បេតិកភណ្ឌ

រូប

អាជីវកម្ម

No videos available

ព័ត៌មាន

ប្រព័ន្ធនយោបាយ

ក្នុងស្រុក

ផលិតផល