ម៉ូដែល AI ត្រូវការសំណុំស្តង់ដារដែលវាយតម្លៃយ៉ាងស៊ីជម្រៅអំពីសមត្ថភាពស្មុគស្មាញ

ការអភិវឌ្ឍន៍យ៉ាងឆាប់រហ័សនៃគំរូ AI ទំនើបគឺទាមទារស្តង់ដារវាយតម្លៃយ៉ាងទូលំទូលាយសម្រាប់សមត្ថភាពស្មុគ្រស្មាញ បង្កើតកម្លាំងរុញច្រានសម្រាប់ការអភិវឌ្ឍន៍គំរូ LLM កម្រិតខ្ពស់។

ZNews•03/10/2025

VMLU (វេទិកាសិក្សា ការវាយតម្លៃ និងចំណាត់ថ្នាក់សម្រាប់ LLMs ភាសាវៀតណាម) 2024 របាយការណ៍ស្ថានភាពអភិវឌ្ឍន៍ (LLM) បានបង្ហាញពីការកើនឡើងយ៉ាងខ្លាំងនៃចំនួន LLMs ដែលផ្តោតលើភាសាវៀតណាម។ ជាពិសេស វេទិកា VMLU បានបោះពុម្ពផ្សាយ LLM ចំនួន 45 នៅលើចំណាត់ថ្នាក់ បានទទួលសំណើវាយតម្លៃពីអង្គការ និងបុគ្គលច្រើនជាង 155 និងបានសង្ខេបការទាញយក 691 នៃលក្ខណៈវិនិច្ឆ័យវាយតម្លៃ និងការវាយតម្លៃ LLM 3,729 ពីវេទិកាក្នុងឆ្នាំ 2024។

អង្គការក្នុងស្រុក និងបរទេសជាច្រើនបាននឹងកំពុងប្រើប្រាស់ VMLU ដូចជា VinBigData, VNPT AI, Viettel Solutions, University of Technology - VNU-HCM, UONLP x Ontocord - University of Oregon (USA), DAMO Academy - Alibaba Group, SDSRV teams - Samsung...

VMLU ភាសាអង់គ្លេស ១

VMLU នឹងចាប់ផ្តើមសំណុំលក្ខណៈវិនិច្ឆ័យវាយតម្លៃ LLM ដំបូងរបស់ខ្លួននៅឆ្នាំ 2023។

ទន្ទឹមនឹងការរីកសាយភាយក្នុងបរិមាណ គុណភាពនៃគំរូ LLM ក៏ត្រូវបានកែលម្អកាន់តែខ្លាំងឡើងផងដែរ។ ប្រសិនបើកាលពីអតីតកាល LLMs ត្រូវបានបណ្តុះបណ្តាលជុំវិញចំណេះដឹងជាមូលដ្ឋាន ឥឡូវនេះអ្នកអភិវឌ្ឍន៍ផ្តោតលើការពង្រីកជំនាញបន្ថែមទៀតដូចជាការអានការយល់ដឹង ការផ្លាស់ប្តូរការសន្ទនា ឬហេតុផលដូចមនុស្ស។

ឆ្លើយតបទៅនឹងការអភិវឌ្ឍន៍ដ៏ខ្លាំងក្លានៃគំរូ LLM របស់វៀតណាមជឿនលឿន VMLU បានបោះពុម្ពនូវស្តង់ដារថ្មីដើម្បីវាយតម្លៃបន្ថែមអំពីសមត្ថភាពស្មុគស្មាញរបស់ម៉ូដែល។

ស្តង់ដារដែលលើកកម្ពស់ឧត្តមភាព LLM

កាលពីមុន នៅពេលដែលទីផ្សារខ្វះស្តង់ដារគុណភាព ក្រុមស្រាវជ្រាវក្នុងស្រុកជាច្រើនត្រូវបង្កើតឧបករណ៍វាយតម្លៃផ្ទៃក្នុងរបស់ពួកគេជាមួយនឹងស្តង់ដារផ្ទាល់ខ្លួនរបស់ពួកគេ។ នេះកំណត់ការវាយតម្លៃ ក៏ដូចជាការប្រៀបធៀបគុណភាពគំរូជាមួយ LLMs ដែលមានស្រាប់នៅលើទីផ្សារ ដើម្បីមានយុទ្ធសាស្ត្របណ្តុះបណ្តាលសមស្រប។

ដើម្បីដោះស្រាយបញ្ហានេះ ក្នុងខែវិច្ឆិកា ឆ្នាំ 2023 VMLU - សំណុំដំបូងនៃស្តង់ដារ "ធ្វើនៅវៀតណាម" ទូទៅត្រូវបានស្រាវជ្រាវដោយក្រុមអ្នកជំនាញវៀតណាមនាំមុខគេ ហើយផ្តល់ជូនសហគមន៍ដោយឥតគិតថ្លៃ។

សំណុំស្តង់ដារនៃសំណួរពហុជម្រើសចំនួន 10,880 ដែលគ្របដណ្តប់លើប្រធានបទចំនួន 58 ដែលបែងចែកជាកម្រិតជាច្រើនបានជួយអ្នកអភិវឌ្ឍន៍ងាយស្រួលចូលប្រើសំណុំទិន្នន័យវាយតម្លៃទូទៅ។ ក្នុងពេលជាមួយគ្នានេះ ទាញយកអត្ថប្រយោជន៍ពីចំណាត់ថ្នាក់របស់ VMLU ដើម្បីប្រៀបធៀបដោយផ្ទាល់នូវគំរូរបស់ពួកគេជាមួយនឹង LLMs ដែលមានស្រាប់នៅលើទីផ្សារ។

លោកបណ្ឌិត Dang Tran Thai ប្រធាននាយកដ្ឋានដំណើរការភាសាធម្មជាតិ - VinBigData Virtual Assistant Technology Block ដែលម៉ូដែល ViGPT-1.6B-v1 ស្ថិតក្នុងចំណាត់ថ្នាក់នៃគំរូពីកោស (LLM បណ្តុះបណ្តាលពីទទេ) របស់ VMLU បាននិយាយថា "VMLU មានទិន្នន័យពេញលេញ និងទូលំទូលាយដើម្បីវាយតម្លៃសមត្ថភាពចំណេះដឹងរបស់ LLM គឺមិនមែនសម្រាប់តែ VLMlu របស់វៀតណាមប៉ុណ្ណោះទេ។ ដំណាក់កាល ប៉ុន្តែក៏ជារង្វាស់នៃប្រសិទ្ធភាពនៃការពិសោធន៍របស់យើងក្នុងអំឡុងពេលដំណើរការបណ្តុះបណ្តាលផងដែរ”។

លោកបណ្ឌិត Dang Tran Thai បន្ថែមថា "នេះនឹងក្លាយជា 'និទាឃរដូវ' ដើម្បីលើកកម្ពស់ការអភិវឌ្ឍនៃ AI ជាទូទៅ និង LLM ពីព្រោះយើងត្រូវតែមានស្តង់ដារល្អដើម្បីឱ្យយើងមានមូលដ្ឋានដើម្បីបណ្តុះបណ្តាលម៉ូដែលដែលមានគុណភាពខ្ពស់" ។

វិស្វករសំខាន់នៅ Microsoft - បណ្ឌិត Bach Hung Nguyen ក៏បានបញ្ជាក់អំពីអត្ថប្រយោជន៍របស់ VMLU ក្នុងការវាយតម្លៃការអនុវត្តគំរូ LLM ជាភាសាវៀតណាម ជួយអង្គភាពអភិវឌ្ឍន៍យល់កាន់តែច្បាស់អំពីសមត្ថភាពរបស់គំរូ។ លើសពីនេះ លោកបណ្ឌិត Bach Hung Nguyen ក៏រំពឹងថា VMLU នឹងបន្ថែមជំនាញដែលមានប្រយោជន៍ដូចជាការវែកញែក ការបង្កើតកូដ និងការសង្ខេបអត្ថបទ។

កំណែថ្មីរបស់ VMLU មានគោលបំណងធ្វើឱ្យម៉ូដែល LLM លំដាប់ខ្ពស់ល្អឥតខ្ចោះ

ថ្មីៗនេះ VMLU បន្តប្រកាសអំពីសំណុំស្តង់ដារថ្មី ដោយវាយតម្លៃពីសមត្ថភាពហេតុផល និងអន្តរកម្មរបស់ LLM ។ សំណុំស្តង់ដារដែលបានពង្រីកវាយតម្លៃជំនាញស្នូលចំនួន 3 នៃ LLM ទំនើប រួមមាន:

Reading Comprehension (ViSQuAD) : សំណួរចំនួន 3,310 វាយតម្លៃសមត្ថភាពក្នុងការយល់អត្ថបទយ៉ាងស៊ីជម្រៅ និងដោះស្រាយសំណួរស្មុគស្មាញដោយផ្អែកលើលក្ខណៈជាក់លាក់នៃភាសា និងបរិបទវៀតណាម។

ការវែកញែក (ViDrop) : 3,090 សំណួរប្រឈមនឹងសមត្ថភាពហេតុផលឡូជីខលរបស់ LLM តាមរយៈកិច្ចការដូចជាការប្រៀបធៀប ការរាប់ និងការគណនានព្វន្ធ។

អន្តរកម្ម (ViDialog) : ការសន្ទនាចំនួន 210 វាយតម្លៃភាពស៊ីសង្វាក់គ្នា សមត្ថភាពក្នុងការយល់អំពីបរិបទ និងអនុវត្តចំណេះដឹងពហុវិន័យ (ប្រវត្តិសាស្ត្រ ភូមិសាស្ត្រ តក្កវិជ្ជា) ក្នុងការសន្ទនា។

ការអាប់ដេតនេះមិនត្រឹមតែជួយអ្នកអភិវឌ្ឍន៍វាយតម្លៃម៉ូដែលកាន់តែទូលំទូលាយប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងផ្សព្វផ្សាយ LLM ដើម្បីបង្កើតតម្លៃមានប្រយោជន៍សម្រាប់អ្នកប្រើប្រាស់ចុងក្រោយ។

បងប្អូន VMLU ២

ស្តង់ដារ VMLU ថ្មីនឹងចេញនៅឆ្នាំ 2025។

លោកបណ្ឌិត Chau Thanh Duc នាយកផ្នែកស្រាវជ្រាវ និងអភិវឌ្ឍន៍បញ្ញាសិប្បនិមិត្តនៅ Zalo AI ដែលជាអង្គការដែលបង្កើត VMLU បាននិយាយថា “បច្ចុប្បន្នមានស្តង់ដាររាប់រយផ្សេងៗគ្នា នៅលើពិភពលោក ដើម្បីវាយតម្លៃសមត្ថភាពនៃគំរូភាសាធំៗ។ ប៉ុន្តែចំនួនស្តង់ដារវាយតម្លៃជាពិសេសសម្រាប់ភាសាវៀតណាមមានកម្រិតណាស់។

សំណុំស្តង់ដារថ្មីត្រូវបានដាក់ឱ្យដំណើរការនៅលើគេហទំព័រ VMLU https://vmlu.ai/ សម្រាប់បុគ្គល និងក្រុមស្រាវជ្រាវដើម្បីវាយតម្លៃគំរូរបស់ពួកគេ។

បងប្អូន VMLU ៣

សំណុំស្តង់ដារថ្មីត្រូវបានធ្វើបច្ចុប្បន្នភាពនៅលើគេហទំព័រ VMLU ។

VMLU គឺជាវេទិកាសម្រាប់ការវាយតម្លៃ និងចំណាត់ថ្នាក់គំរូ LLM របស់វៀតណាមដែលបង្កើតឡើងដោយ Zalo AI សហការជាមួយវិទ្យាស្ថាន វិទ្យាសាស្ត្រ និងបច្ចេកវិទ្យាទំនើបជប៉ុន (JAIST) និងផ្តល់ជូនសហគមន៍ដោយឥតគិតថ្លៃចាប់ពីខែវិច្ឆិកា ឆ្នាំ 2023។ ជាមួយនឹងការខិតខំប្រឹងប្រែងដើម្បីរួមដំណើរជាមួយសហគមន៍ AI វៀតណាម VMLU កំពុងរួមចំណែកលើកកម្ពស់សមត្ថភាពប្រជាជនវៀតណាមក្នុងការធ្វើជាម្ចាស់នៃបច្ចេកវិទ្យាថ្មី។ អាស្រ័យហេតុនេះ រួមចំណែកដល់យុគសម័យនៃការអភិវឌ្ឍន៍បច្ចេកវិទ្យារបស់ប្រទេសជាមួយនឹងការតំរង់ទិសឈានមុខគេក្នុងវិស័យវិទ្យាសាស្ត្រ បច្ចេកវិទ្យា នវានុវត្តន៍ និងការផ្លាស់ប្តូរឌីជីថលជាតិ។

ប្រភព៖ https://znews.vn/mo-hinh-ai-dang-can-bo-tieu-chuan-danh-gia-sau-cac-nang-luc-phuc-tap-post1589901.html