ចំណុចប្រទាក់របស់ v7, ក្តារចុចដែលរួមបញ្ចូល AI។ រូបថត៖ ផ្តល់ដោយអ្នកនិពន្ធ ។ |
ថ្លែងទៅកាន់ Tri Thức - Znews លោក Tri Duc (កើតនៅឆ្នាំ 2003) បានចែករំលែកគំនិតរបស់លោកអំពីការអនុវត្តបញ្ញាសិប្បនិម្មិតដើម្បីផ្លាស់ប្តូររបៀបដែលភាសាវៀតណាមត្រូវបានបញ្ចូល។ គម្រោងក្តារចុច v7 របស់លោកឥឡូវនេះបានអភិវឌ្ឍទៅជាឯកសារស្រាវជ្រាវ ហើយត្រូវបានទទួលយកនៅ IJCAI 2025 ដែលជាសន្និសីទ AI ដ៏មានកិត្យានុភាពមួយ។
ទោះបីជាមានប្រជាប្រិយភាពអស់ជាច្រើនទសវត្សរ៍មកហើយក៏ដោយ វិធីសាស្ត្របញ្ចូល Telex ឬ VNI នៅតែមានដែនកំណត់ជាច្រើនទាក់ទងនឹងបទពិសោធន៍អ្នកប្រើប្រាស់។ ដូច្នេះ v7 ត្រូវបានបង្កើតឡើងជាឧបករណ៍ទស្សន៍ទាយទម្ងន់ស្រាល ដែលជួយកាត់បន្ថយពេលវេលាវាយអក្សរវៀតណាម ដោយសារបញ្ញាសិប្បនិម្មិត (AI) ដែលរួមបញ្ចូលគ្នា។
ចំណង់ចំណូលចិត្តចំពោះភាសា និងបច្ចេកវិទ្យា។
ចំណង់ចំណូលចិត្តរបស់គាត់ចំពោះភាសា និងបច្ចេកវិទ្យាបាននាំឱ្យលោក ឌឹក សិក្សាជំនាញបញ្ញាសិប្បនិម្មិតអនុវត្តនៅសាកលវិទ្យាល័យបច្ចេកវិទ្យាទីក្រុងហូជីមិញ។
ក្នុងអំឡុងពេលសិក្សារបស់គាត់ គាត់បានធ្វើការលើគម្រោងដូចជា ការធ្វើគំរូភាសាទ្រង់ទ្រាយធំ (LLM) សម្រាប់ភាសាវៀតណាម កម្មវិធីសម្រាប់បកប្រែភាសាជនជាតិភាគតិច និង chatbots ដើម្បីគាំទ្រដល់ការជ្រើសរើសនិស្សិត។ គាត់បានចែករំលែកថា “បទពិសោធន៍ទាំងនេះបានជួយខ្ញុំកសាងមូលដ្ឋានគ្រឹះរឹងមាំនៃចំណេះដឹង បណ្តុះចំណង់ចំណូលចិត្តរបស់ខ្ញុំ និងជំរុញបំណងប្រាថ្នារបស់ខ្ញុំក្នុងការអនុវត្ត AI ដើម្បីបង្កើតផលិតផលដែលផ្តល់អត្ថប្រយោជន៍ដល់សហគមន៍”។
ទ្រីឌឹក មានគោលបំណងនាំមកនូវតម្លៃដល់ជីវិតដោយការអនុវត្តបញ្ញាសិប្បនិម្មិត (AI)។ រូបថត៖ ផ្តល់ដោយអ្នកសម្ភាសន៍។ |
លើសពីនេះ ដោយមានប្រវត្តិជាភាសាចិនកុកងឺ និងកាតាំង លោកឌឹកបានទទួលស្គាល់ទំនាក់ទំនងរវាងអក្សរ pinyin/jyutping និងការសរសេរអក្ខរាវិរុទ្ធវៀតណាម។ នេះក៏បង្ហាញផងដែរថា ផ្ទុយពីភាពស្មុគស្មាញនៃតួអក្សរអរូបី វិធីសាស្ត្របញ្ចូលអក្សរ pinyin របស់ចិនតម្រូវឱ្យបញ្ចូល "yn" ដើម្បីបង្កើតឈ្មោះប្រទេសរបស់យើងជាតួអក្សរចិន។ ផ្ទុយទៅវិញ Telex ឬ VNI តម្រូវឱ្យមានគ្រាប់ចុចចំនួន 10 ដើម្បីបង្កើត "វៀតណាម"។
តាមរយៈការសង្កេតរបស់គាត់ លោក Duc បានដឹងថា នៅក្នុងការសន្ទនារហ័ស អ្នកប្រើប្រាស់ច្រើនតែកាត់អក្សរដោយរក្សាព្យញ្ជនៈដំបូង ដូចជា "hs" សម្រាប់ "សិស្ស"។ គាត់បានពន្យល់អំពីកាលៈទេសៈដែលនាំឱ្យមានគំនិតរបស់គាត់ថា "ប្រសិនបើមនុស្សអាចយល់រចនាប័ទ្មសរសេរនេះបានយ៉ាងងាយស្រួល បញ្ញាសិប្បនិម្មិត (AI) អាចយល់វាបានយ៉ាងពិតប្រាកដ ប្រសិនបើត្រូវបានបណ្តុះបណ្តាលជាមួយនឹងទិន្នន័យត្រឹមត្រូវ"។
ជំនួសឲ្យការវាយអក្សរទាំងអស់ ហើយបន្ទាប់មកបន្ថែមសញ្ញាវណ្ណយុត្តិដូចវិធីសាស្ត្របញ្ចូលបែបប្រពៃណីដូចជា Telex ឬ VNI ដែលពឹងផ្អែកលើយន្តការបំពេញបន្ថែម v7 ប្រើប្រាស់ AI ដើម្បីណែនាំពាក្យដែលអ្នកចង់សរសេរ។ បច្ចេកវិទ្យានេះនឹងទស្សន៍ទាយពាក្យពេញលេញបានយ៉ាងត្រឹមត្រូវជាមួយនឹងគ្រាប់ចុចតិចបំផុតដែលអាចធ្វើទៅបាន។
នៅក្នុងអក្ខរាវិរុទ្ធវៀតណាម ពាក្យមួយមានព្យញ្ជនៈដើម ស្រៈ និងសម្លេង។ ឧទាហរណ៍ ពាក្យ "ង្វៀន" ត្រូវបានផ្សំឡើងដោយ "ង" "អុយយិន" និងសម្លេងធ្លាក់ចុះ។ ដោយផ្អែកលើគោលការណ៍នេះ វិធីសាស្ត្របញ្ចូល v7 ត្រូវបានបង្កើតឡើងដើម្បីទស្សន៍ទាយពាក្យពេញលេញដោយប្រើតែព្យញ្ជនៈ និងសម្លេងដំបូង ដែលកាត់បន្ថយចំនួននៃការចុចគ្រាប់ចុចយ៉ាងច្រើន ខណៈពេលដែលរក្សាភាពត្រឹមត្រូវ។
បញ្ហាប្រឈមនៃការបង្រៀនភាសាវៀតណាមដល់ AI។
យោងតាមលោក Duc បញ្ហាប្រឈមដ៏ធំបំផុតគឺការបង្រៀន AI ឱ្យ "យល់" ភាសាវៀតណាម ដើម្បីប្រើវិធីសាស្ត្របញ្ចូលនេះ។ គាត់បានសាកល្បងម៉ូដែលជាច្រើនមុនពេលជ្រើសរើស GPT-2 ជាមូលដ្ឋានគ្រឹះ ជាមួយនឹងស្ថាបត្យកម្ម Transformers របស់វាផ្តល់នូវការយល់ដឹងតាមបរិបទល្អ និងការទស្សន៍ទាយពាក្យត្រឹមត្រូវ។
បន្ទាប់ពីជ្រើសរើសស្ថាបត្យកម្មមូលដ្ឋានរួច ឌុច បានជំនួស Tokenizer (ឧបករណ៍អ៊ិនកូដវាក្យសព្ទ) ទាំងស្រុងជាមួយនឹងសំណុំវាក្យសព្ទវៀតណាមផ្ទាល់ខ្លួនរបស់គាត់។ វិស្វករបានត្រង និងរួមបញ្ចូលពាក្យវៀតណាមដែលមានសុពលភាព និងសរសេរបានត្រឹមត្រូវទាំងអស់ ដើម្បីធានាបាននូវសមត្ថភាពដំណើរការដ៏ទូលំទូលាយ និងសមត្ថភាពក្នុងការទស្សន៍ទាយពាក្យណាមួយដែលអ្នកប្រើប្រាស់មានបំណងសរសេរ។
បញ្ហាប្រឈមមួយទៀតគឺការធ្វើឱ្យមានតុល្យភាពរវាងដំណើរការព្យាករណ៍ និងល្បឿនឆ្លើយតប ដោយធានាថាម៉ូដែលនេះអាចដំណើរការបានភ្លាមៗទាំងនៅលើកុំព្យូទ័រ និងទូរស័ព្ទ ខណៈពេលដែលនៅតែមានថាមពលគ្រប់គ្រាន់ដើម្បីផ្តល់នូវការព្យាករណ៍ដ៏ល្អបំផុត។ បន្ទាប់ពីការធ្វើតេស្តជាបន្តបន្ទាប់រយៈពេលពីរខែ កំណែបច្ចុប្បន្នដាក់ពាក្យដែលអ្នកប្រើប្រាស់បញ្ចូលបានជិត 70% នៅផ្នែកខាងលើយ៉ាងត្រឹមត្រូវ ដោយមានការពន្យាពេលត្រឹមតែ 0.03 វិនាទីប៉ុណ្ណោះ។
ទាក់ទងនឹងវិធីសាស្ត្របញ្ចូលក្តារចុច យោងតាមការសិក្សាជាច្រើនដែលលោក Duc បានពិគ្រោះជាមួយអ្នកជំនាញភាសាវិទ្យា Cao Xuan Hao និង Henri Maspero ភាសាវៀតណាមមិនត្រឹមតែមានសំឡេង 6 ប៉ុណ្ណោះទេ ប៉ុន្តែមានសំឡេងរហូតដល់ 8 សំឡេង។ ដើម្បីទាញយកអត្ថប្រយោជន៍ពីលក្ខណៈនេះ v7 ប្រើប្រព័ន្ធ 8 សំឡេងជំនួសឱ្យសំឡេង 6 ធម្មតា (រួមទាំងសំឡេងកម្រិតមួយ និងសំឡេង 5 សំឡេងដែលមានសញ្ញាសង្កត់សំឡេង៖ មុតស្រួច ធ្ងន់ធ្ងរ សំណួរ សញ្ញា tilde និងចំណុចខាងក្រោម)។ នៅក្នុងក្តារចុចនេះ នៅពេលអ្នកបញ្ចូល "v7" ម៉ូដែលនឹងណែនាំពាក្យ "Viet"។ នេះក៏ជាគំនិតនៅពីក្រោយឈ្មោះផលិតផលផងដែរ។
បន្ទាប់ពីចែករំលែក v7 នៅលើបណ្តាញសង្គមរបស់គាត់ លោក Duc បាននិយាយថា លោកមានសេចក្តីរីករាយ និងភ្ញាក់ផ្អើលយ៉ាងខ្លាំងដែលគំរូនេះទទួលបានការយកចិត្តទុកដាក់ ការគាំទ្រ និងបំណងប្រាថ្នាចង់សាកល្បងវា។ លោកបាននិយាយថា "នោះបានផ្តល់ឱ្យខ្ញុំនូវអារម្មណ៍ច្បាស់លាស់អំពីតម្រូវការសម្រាប់វិធីសាស្ត្របញ្ចូលភាសាវៀតណាមដែលឆ្លាតវៃ និងលឿនជាងមុន"។
អ្នកនិពន្ធឯកសារស្រាវជ្រាវ វិទ្យាសាស្ត្រ ។ ពីឆ្វេងទៅស្តាំ៖ ញ៉ាត់ខាង, ហៀវងៀ និង ទ្រីឌឹក។ រូបថត៖ ផ្តល់ដោយអ្នកនិពន្ធ។ |
បច្ចុប្បន្ននេះ វិធីសាស្ត្របញ្ចូលនៅតែស្ថិតក្នុងដំណាក់កាលគំរូដើមនៅឡើយ ជាមួយនឹងកូដប្រភពបើកចំហនៅលើ GitHub សម្រាប់អ្នកសរសេរកម្មវិធី និងអ្នកប្រើប្រាស់បច្ចេកវិទ្យាដើម្បីសាកល្បង និងចូលរួមចំណែក។ កំណែកម្មវិធីពេញលេញសម្រាប់ Windows និង macOS ក៏កំពុងត្រូវបានបង្កើតឡើងសម្រាប់អ្នកប្រើប្រាស់ទូទៅ ដែលធ្វើឱ្យវាងាយស្រួលក្នុងការដំឡើង និងប្រើប្រាស់។
នាពេលអនាគត អាទិភាពចម្បងសម្រាប់ v7 គឺកំណែក្តារចុច iPhone ដោយមានគោលបំណងកែលម្អវិធីដែលអក្សរវៀតណាមត្រូវបានបញ្ចូលនៅលើស្មាតហ្វូន។ លើសពីនេះ ភាពត្រឹមត្រូវរបស់ម៉ូដែលនឹងត្រូវបានកែលម្អដោយការបណ្តុះបណ្តាលបន្ថែមទៀតលើទិន្នន័យសន្ទនាប្រចាំថ្ងៃ ដែលជួយឱ្យ AI យល់កាន់តែច្បាស់អំពីបរិបទទូទៅ។
ដំណើររបស់លោក Duc បានរួមចំណែកដល់ការចាក់បញ្ចូលរលកនៃការច្នៃប្រឌិត ដោយរក្សាល្បឿនជាមួយនឹងនិន្នាការបច្ចេកវិទ្យានៅក្នុងបរិបទនៃការវិនិយោគដ៏រឹងមាំរបស់វៀតណាមលើហេដ្ឋារចនាសម្ព័ន្ធ AI។ ពេលវេលាមួយដែលធ្វើឲ្យលោកមានមោទនភាពគឺនៅពេលដែល v7 បានបង្កើតប្រយោគពេញលេញមួយជាលើកដំបូង។ លោក Duc បាននិយាយថា "នោះហើយជាពេលដែលគំរូតូចមួយ ប្រហែលជាមានទំហំត្រឹមតែ 1/10000 នៃទំហំ ChatGPT សព្វថ្ងៃនេះ នៅតែអាចគិតដូចមនុស្សបាន"។
ប្រភព៖ https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






Kommentar (0)