ការបង្រៀន AI ឱ្យបញ្ចេញសំឡេង

ដោយបានបំផុសគំនិតដោយមេកានិកនៃបំពង់ក គំរូបញ្ញាសិប្បនិម្មិត (AI) ថ្មីអាចបង្កើត និងយល់ពីការក្លែងធ្វើសំឡេងប្រចាំថ្ងៃ។

វិធីសាស្រ្តនេះអាចជួយក្នុងការអភិវឌ្ឍចំណុចប្រទាក់សំឡេងថ្មីសម្រាប់វិស័យកម្សាន្ត និង ការអប់រំ ។

ការធ្វើត្រាប់តាមសំឡេងដោយប្រើសំឡេងរបស់អ្នកគឺដូចជាការគូររូបភាពរហ័សដើម្បីបង្ហាញអ្វីដែលអ្នកឃើញ។ ជំនួសឱ្យការប្រើខ្មៅដៃដើម្បីបង្ហាញរូបភាព អ្នកអាចប្រើសម្លេងរបស់អ្នកដើម្បីតំណាងឱ្យសំឡេង។ ខណៈពេលដែលវាហាក់ដូចជាពិបាក ប៉ុន្តែវាគឺជាអ្វីដែលមនុស្សធ្វើដោយធម្មជាតិ។ សាកល្បងធ្វើត្រាប់តាមស៊ីរ៉ែនរថយន្តសង្គ្រោះ សំឡេងក្អែក ឬកណ្តឹង ដើម្បីទទួលបទពិសោធន៍នេះ។

ដោយមានការបំផុសគំនិតដោយ វិទ្យាសាស្ត្រ ការយល់ដឹងអំពីរបៀបដែលយើងប្រាស្រ័យទាក់ទងគ្នា អ្នកស្រាវជ្រាវនៅមន្ទីរពិសោធន៍វិទ្យាសាស្ត្រកុំព្យូទ័រ និងបញ្ញាសិប្បនិមិត្ត (CSAIL) របស់ MIT បានបង្កើតប្រព័ន្ធ AI ដែលមានសមត្ថភាពបង្កើតការក្លែងធ្វើសំឡេងដូចមនុស្សដោយមិនចាំបាច់មានការហ្វឹកហាត់ណាមួយឡើយ ហើយមិនធ្លាប់ "ឮ" សំឡេងក្លែងធ្វើមនុស្សពីមុនមក។

ដើម្បីសម្រេចបាននូវចំណុចនេះ ក្រុមការងារបានរចនាប្រព័ន្ធរបស់ពួកគេដើម្បីបង្កើត និងបកស្រាយសំឡេងតាមរបៀបដែលមនុស្សធ្វើ។ ពួកគេបានចាប់ផ្តើមដោយបង្កើតគំរូនៃបំពង់សំឡេងរបស់មនុស្ស ដោយធ្វើត្រាប់តាមរបៀបដែលការរំញ័រចេញពីបំពង់ក មានរាងតាមបំពង់ក អណ្តាត និងបបូរមាត់។ បន្ទាប់មកពួកគេបានប្រើក្បួនដោះស្រាយ AI ដែលបំផុសគំនិតដោយការយល់ដឹង ដើម្បីជំរុញគំរូ បង្កើតការក្លែងធ្វើសំឡេង ខណៈពេលដែលគិតគូរពីវិធីពិសេសនៃការទំនាក់ទំនងសំឡេងនៅក្នុងបរិបទនីមួយៗ។

ម៉ូដែលនេះអាចផលិតឡើងវិញនូវសំឡេងបរិស្ថានជាច្រើនដូចជា ស្លឹកច្រែះ សម្លេងពស់ ឬស៊ីរ៉ែនរថយន្តសង្គ្រោះ។ លើសពីនេះ ម៉ូដែលនេះអាចធ្វើការបញ្ច្រាស់ដើម្បីទស្សន៍ទាយសំឡេងពិតពីការក្លែងធ្វើនៃការនិយាយរបស់មនុស្ស ដូចជារបៀបដែលប្រព័ន្ធចក្ខុវិស័យកុំព្យូទ័រមួយចំនួនអាចបង្កើតរូបភាពដែលមានគុណភាពខ្ពស់ឡើងវិញពីគំនូរព្រាង។ ជាឧទាហរណ៍ គំរូអាចបែងចែកបានយ៉ាងត្រឹមត្រូវរវាង "meow" និង "purr" របស់ឆ្មា នៅពេលដែលធ្វើត្រាប់តាមមនុស្ស។

នៅពេលអនាគត គំរូនេះអាចនាំទៅរកចំណុចប្រទាក់ "ផ្អែកលើការក្លែងធ្វើ" ដ៏វិចារណញាណបន្ថែមទៀតសម្រាប់អ្នករចនាសំឡេង តួអក្សរ AI ដូចមនុស្សកាន់តែច្រើននៅក្នុងការពិតនិម្មិត និងសូម្បីតែវិធីសាស្រ្តដើម្បីជួយសិស្សរៀនភាសាបរទេស។

អ្នកនិពន្ធនាំមុខនៃការសិក្សា - និស្សិតបញ្ចប់ការសិក្សា MIT CSAIL Kartik Chandra និង Karima Ma និងនិស្សិតបញ្ចប់ការសិក្សា Matthew Caren - ចំណាំថាអ្នកស្រាវជ្រាវក្រាហ្វិកកុំព្យូទ័របានទទួលស្គាល់ជាយូរមកហើយថាភាពប្រាកដនិយមមិនមែនជាគោលដៅចុងក្រោយនៃការបញ្ចេញមតិ។ ឧទាហរណ៍ គំនូរអរូបី ឬ doodle របស់កុមារអាចបង្ហាញបានដូចរូបថត។

សិល្បៈនៃការក្លែងធ្វើសំឡេងជា 3 ដំណាក់កាល

ក្រុមនេះបានបង្កើតកំណែស្មុគ្រស្មាញកាន់តែខ្លាំងឡើងចំនួនបីនៃគំរូដើម្បីប្រៀបធៀបជាមួយនឹងការក្លែងធ្វើសំឡេងរបស់មនុស្ស។ ដំបូងឡើយ ពួកគេបានបង្កើតគំរូមូលដ្ឋានមួយដែលផ្តោតតែលើការបង្កើតការក្លែងធ្វើដែលនៅជិតសំឡេងពិតតាមដែលអាចធ្វើទៅបាន ប៉ុន្តែគំរូនេះមិនត្រូវគ្នានឹងអាកប្បកិរិយារបស់មនុស្សទេ។

បន្ទាប់មក ក្រុមការងារបានរចនាគំរូទីពីរដែលហៅថាគំរូទំនាក់ទំនង។ យោងទៅតាម Caren ម៉ូដែលនេះគិតគូរពីធាតុផ្សំនៃសម្លេងដែលមានលក្ខណៈប្លែកសម្រាប់អ្នកស្តាប់។ ជាឧទាហរណ៍ អ្នកអាចធ្វើត្រាប់តាមសំឡេងរបស់កប៉ាល់ដោយក្លែងបន្លំសំឡេងគ្រហឹមនៃម៉ាស៊ីនរបស់វា ព្រោះនោះគឺជាលក្ខណៈដែលអាចស្គាល់បានបំផុតនៃសំឡេង ទោះបីជាវាមិនមែនជាធាតុខ្លាំងបំផុតក៏ដោយ (ដូចជាសំឡេងទឹកហូរ)។ ម៉ូដែលនេះមានភាពប្រសើរឡើងខ្លាំងជាងកំណែដំបូង។

ជាចុងក្រោយ ក្រុមការងារបានបន្ថែមស្រទាប់នៃហេតុផលទៅម៉ូដែល។ Chandra ពន្យល់ថា "សំឡេងដែលក្លែងធ្វើអាចប្រែប្រួលអាស្រ័យលើការខិតខំប្រឹងប្រែងដែលអ្នកបានដាក់ចូលទៅក្នុងពួកវា" ។ "វាត្រូវការពេលវេលា និងថាមពលដើម្បីបង្កើតសំឡេងត្រឹមត្រូវ"។ គំរូចុងក្រោយរបស់ក្រុមគិតរឿងនេះដោយជៀសវាងសំឡេងដែលលឿនពេក ខ្លាំងពេក ឬខ្ពស់/ទាបពេក—ធាតុដែលទំនងជាមិនសូវកើតឡើងនៅក្នុងការនិយាយធម្មតា។ លទ្ធផលគឺការក្លែងធ្វើដូចមនុស្សកាន់តែច្រើន ដែលឆ្លុះបញ្ចាំងពីការសម្រេចចិត្តជាច្រើនដែលមនុស្សធ្វើនៅពេលត្រាប់តាមសំឡេងស្រដៀងគ្នា។

ឆ្ពោះទៅរកបច្ចេកវិជ្ជាសំឡេងដែលបង្ហាញឱ្យឃើញកាន់តែច្រើន

គំរូនេះអាចជួយសិល្បករក្នុងការប្រាស្រ័យទាក់ទងគ្នាបានកាន់តែល្អជាមួយសំឡេងជាមួយប្រព័ន្ធគណនា ដោយជួយអ្នកផលិតភាពយន្ត និងអ្នកបង្កើតមាតិកាបង្កើតសំឡេង AI ដែលពាក់ព័ន្ធតាមបរិបទ។ វាក៏អាចអនុញ្ញាតឱ្យអ្នកតន្ត្រីស្វែងរកយ៉ាងឆាប់រហ័សនូវមូលដ្ឋានទិន្នន័យសំឡេងដោយក្លែងបន្លំសំឡេងដែលពិបាកពណ៌នាក្នុងអត្ថបទ។

ទន្ទឹមនឹងនោះ ក្រុមការងារកំពុងពិនិត្យមើលកម្មវិធីគំរូក្នុងផ្នែកផ្សេងទៀត រួមទាំងការអភិវឌ្ឍន៍ភាសា របៀបដែលទារករៀននិយាយ និងអាកប្បកិរិយាត្រាប់តាមរបស់សត្វស្លាប ដូចជាសេក និងបក្សីចម្រៀងជាដើម។

ទោះជាយ៉ាងណាក៏ដោយ គំរូបច្ចុប្បន្ននៅតែមានដែនកំណត់មួយចំនួន៖ វាតស៊ូជាមួយព្យញ្ជនៈដូចជា "z" ដែលនាំឱ្យមានការក្លែងធ្វើមិនត្រឹមត្រូវនៃសំឡេងដូចជាសត្វឃ្មុំដែលកំពុងស្រែក។ លើសពីនេះ វាមិនទាន់អាចចម្លងពីរបៀបដែលមនុស្សយកតម្រាប់តាមការនិយាយ តន្ត្រី ឬសំឡេងដែលត្រូវបានគេយកតម្រាប់តាមភាសាផ្សេងៗគ្នា ដូចជាចង្វាក់បេះដូងនោះទេ។

Robert Hawkins សាស្ត្រាចារ្យផ្នែកភាសានៅសាកលវិទ្យាល័យ Stanford បាននិយាយថា "ការផ្លាស់ប្តូរពីសំឡេងឆ្មាពិតទៅពាក្យ 'meow' បង្ហាញពីអន្តរកម្មដ៏ស្មុគស្មាញរវាងសរីរវិទ្យា ហេតុផលសង្គម និងការប្រាស្រ័យទាក់ទងគ្នាក្នុងការវិវត្តនៃភាសា" ។ "គំរូនេះគឺជាជំហានដ៏គួរឱ្យរំភើបមួយឆ្ពោះទៅមុខក្នុងការបង្កើតជាផ្លូវការ និងសាកល្បងទ្រឹស្តីអំពីដំណើរការទាំងនេះ"។

(ប្រភព៖ MIT News)

ប្រភព៖ https://vietnamnet.vn/day-ai-bieu-dat-am-thanh-2362906.html