Vietnam.vn - Nền tảng quảng bá Việt Nam

តើបច្ចេកវិទ្យាចម្លងសំឡេង AI និងបច្ចេកវិទ្យាក្លូនដំណើរការយ៉ាងដូចម្តេច?

Công LuậnCông Luận26/08/2023


នៅពេលដែលឧស្សាហកម្មព័ត៌មានបែបប្រពៃណីទទួលយកការបំប្លែងឌីជីថល និងស្វែងរកវិធីច្នៃប្រឌិតថ្មីដើម្បីទាក់ទាញអ្នកអាន ការក្លូនសំឡេង និងអត្ថបទទៅការនិយាយ (TTS) កំពុងផ្តល់នូវអត្ថប្រយោជន៍ជាច្រើនដែលសន្យាថានឹងធ្វើបដិវត្តបទពិសោធន៍នៃការអាន និងបើកឱកាសថ្មីសម្រាប់អ្នកនិពន្ធ និងបន្ទប់ព័ត៌មានដូចគ្នា។

តើបច្ចេកវិទ្យាចម្លងសំឡេង និងការចម្លងគឺជាអ្វី ហើយតើវាដំណើរការយ៉ាងដូចម្តេច? រូបភាព ១

រូបថតគំនូរ។ ប្រភព៖ SS

តើអត្ថបទទៅជាការនិយាយគឺជាអ្វី?

TTS ដូចដែលឈ្មោះបានបង្ហាញគឺជាបច្ចេកវិទ្យាដែលបំប្លែងអត្ថបទដែលសរសេរទៅជាការនិយាយ។ ការបង្កើតថ្មីនេះភ្ជាប់គម្លាតរវាងមនុស្ស និងភាសាម៉ាស៊ីន ដែលអនុញ្ញាតឱ្យកុំព្យូទ័រ ស្មាតហ្វូន និងឧបករណ៍ផ្សេងទៀតអាចទំនាក់ទំនងជាមួយមនុស្សតាមរយៈសំឡេង។ ដំណើរការនេះពាក់ព័ន្ធនឹងក្បួនដោះស្រាយស្មុគ្រស្មាញ និងគំរូភាសាធំៗ ដើម្បីវិភាគអត្ថបទបញ្ចូល និងបង្កើតអូឌីយ៉ូលទ្ធផលជាមួយនឹងសំឡេងត្រឹមត្រូវ ការបញ្ចេញសំឡេង និងចង្វាក់។

កម្មវិធីនៃបច្ចេកវិទ្យា TTS លើសពីការបង្កើនបទពិសោធន៍អ្នកប្រើប្រាស់ជាមួយនឹងលក្ខណៈពិសេសភាពងាយស្រួលសម្រាប់អ្នកពិការភ្នែក។ វាបានក្លាយជាធាតុផ្សំដ៏សំខាន់នៃជំនួយការនិម្មិត និងសៀវភៅជាសំឡេង ប្រព័ន្ធរុករក ឧបករណ៍សិក្សាភាសា។

AI Voice Cloning

ការក្លូនសំឡេង AI ដែលត្រូវបានគេស្គាល់ថាជាការសំយោគការនិយាយ គឺជាកម្មវិធីកម្រិតខ្ពស់នៃបញ្ញាសិប្បនិមិត្តដែលពាក់ព័ន្ធនឹងការបណ្តុះបណ្តាលគំរូម៉ាស៊ីនរៀនដើម្បីបង្កើតសំឡេងរបស់មនុស្សឡើងវិញដោយផ្អែកលើការប្រមូលទិន្នន័យសំឡេង។ នេះពាក់ព័ន្ធនឹងការថតសំណាកសំណាកអូឌីយ៉ូមួយចំនួនធំពីសំលេងគោលដៅ ដោយចាប់យកសំណាកសំណាកសំលេងជាមួយនឹងភាពខុសប្លែកគ្នា។

ចំណុចសំខាន់នៃការក្លូនសំឡេង AI គឺម៉ូដែលផ្អែកលើបណ្តាញសរសៃប្រសាទ។ ម៉ូដែលទាំងនេះវិភាគទិន្នន័យការនិយាយ រៀនព័ត៌មានលម្អិតដ៏ស្មុគស្មាញនៃសំឡេងរបស់អ្នកនិយាយ និងបង្កើតសំឡេងថ្មីដែលស្តាប់ទៅស្រដៀងនឹងសំឡេងដើម។

លទ្ធភាពប្រើប្រាស់បានប្រសើរឡើង

អត្ថប្រយោជន៍ដ៏សំខាន់បំផុតមួយនៃការរួមបញ្ចូលគ្នារវាងការចម្លងសំឡេង TTS និង AI ក្នុងការបោះពុម្ពគឺការបង្កើនភាពងាយស្រួល។ ជាមួយនឹង TTS ខ្លឹមសារដែលបានសរសេរអាចត្រូវបានបំប្លែងទៅជាការនិយាយ ដែលអនុញ្ញាតឱ្យអ្នកអានពិការភ្នែកចូលទៅកាន់សៀវភៅ កាសែត និងសម្ភារៈសរសេរផ្សេងទៀតជាទម្រង់អូឌីយ៉ូ។ ការរួមបញ្ចូលនេះធានាថាមាតិកាអាចចូលប្រើបានសម្រាប់ទស្សនិកជនកាន់តែទូលំទូលាយ ដោយបំបែកឧបសគ្គសម្រាប់អ្នកដែលមិនអាចអានបាន។

មនុស្សដែលមិនមានពេលអាន

សម្រាប់ទស្សនិកជនដែលមានពេលវេលាកំណត់ ឬរយៈពេលនៃការយកចិត្តទុកដាក់ ការប្រើប្រាស់ខ្លឹមសារអនឡាញអាចចំណាយពេលច្រើន និងហត់នឿយ។ ដំណើរការនេះអាចធុញទ្រាន់ ដែលធ្វើឱ្យវាពិបាកក្នុងការរក្សាព័ត៌មានចុងក្រោយបំផុត។

ក្នុងន័យនេះ ឧបករណ៍ TTS ធ្វើឱ្យការធ្វើបច្ចុប្បន្នភាពព័ត៌មានកាន់តែងាយស្រួល និងងាយស្រួលជាងមុន។ ឧបករណ៍ទាំងនេះផ្តល់នូវបទពិសោធន៍អូឌីយ៉ូដ៏រស់រវើកដែលស្រដៀងនឹងការនិយាយធម្មជាតិ ដោយបង្វែរអត្ថបទទៅជាខ្លឹមសារនិយាយដែលទាក់ទាញ។

TTS អនុញ្ញាតឱ្យអ្នកអានចំណាយពេលវេលារបស់ពួកគេឱ្យបានច្រើនបំផុត និងទទួលបានព័ត៌មានពេលកំពុងធ្វើសកម្មភាពផ្សេងទៀត។

TTS បង្កើនការចូលរួមរបស់អ្នកប្រើប្រាស់ក្នុងយុគសម័យឌីជីថល

នៅក្នុងទិដ្ឋភាពឌីជីថលនាពេលបច្ចុប្បន្ននេះ បច្ចេកវិទ្យា TTS បានលេចចេញជាឧបករណ៍ដ៏មានប្រសិទ្ធភាពសម្រាប់ការចែកចាយព័ត៌មានជាទម្រង់អូឌីយ៉ូ។ ស្ថិតិថ្មីៗបានបង្ហាញថា 10% នៃអ្នកអានជ្រើសរើសស្តាប់អត្ថបទ ហើយជាង 75% ធ្វើតាមរហូតដល់ចប់។ នេះបង្ហាញពីសក្តានុពលរបស់ TTS ក្នុងការបង្កើនការយកចិត្តទុកដាក់របស់អ្នកប្រើប្រាស់យ៉ាងសំខាន់សម្រាប់មាតិកាឌីជីថល។

គួរកត់សម្គាល់ថាអ្នកអានវ័យក្មេងរកឃើញទម្រង់អូឌីយ៉ូដែលទាក់ទាញជាពិសេសដោយសារតែភាពងាយស្រួល និងការខិតខំប្រឹងប្រែងតិច ឬតម្រូវការពេលវេលារបស់វា។ អ្នកបោះពុម្ពផ្សាយក៏បានរាយការណ៍ផងដែរអំពីការបង្កើនការជាវ និងប្រាក់ចំណូលតាមរយៈការផ្សាយពាណិជ្ជកម្មជាសំឡេង ធ្វើឱ្យ TTS ជាវិធីសាស្រ្តដ៏រឹងមាំមួយចំពោះកំណើនប្រកបដោយនិរន្តរភាពនៅក្នុងឧស្សាហកម្មបោះពុម្ពផ្សាយព័ត៌មាន។

ការធ្វើបដិរូបកម្ម និងបទពិសោធន៍ដ៏អស្ចារ្យ

ការ​ក្លូន​សំឡេង AI ធ្វើ​ឲ្យ​ការ​ចូល​រួម​របស់​អ្នក​អាន​ទៅ​កម្រិត​មួយ​ទៀត ដោយ​ផ្ដល់​ការ​រៀបរាប់​ផ្ទាល់​ខ្លួន។ ជាមួយនឹងសមត្ថភាពក្នុងការចម្លងសំឡេងរបស់បុគ្គលពិតប្រាកដ អ្នកបោះពុម្ពផ្សាយអាចចែកចាយអត្ថបទ សៀវភៅជាសំឡេង និងខ្លឹមសារសំឡេងផ្សេងទៀតដែលរៀបរាប់ដោយអ្នកកែសម្រួល អ្នកនិពន្ធ ឬតារាល្បី។

នេះមិនត្រឹមតែធ្វើឱ្យទំនាក់ទំនងរវាងអ្នកទស្សនា និងខ្លឹមសារកាន់តែស៊ីជម្រៅប៉ុណ្ណោះទេ វាថែមទាំងបង្កើនបទពិសោធន៍ដ៏អស្ចារ្យ ដែលអនុញ្ញាតឱ្យអ្នកអានមានអារម្មណ៍ថាពួកគេកំពុងស្តាប់អ្នកនិពន្ធប្រាប់រឿងរបស់ពួកគេដោយផ្ទាល់។

ពេលវេលា និងការចំណាយមានប្រសិទ្ធភាព

ការរួមបញ្ចូលគ្នារវាង TTS និង AI បច្ចេកវិទ្យាក្លូនសំឡេងនៅក្នុងដំណើរការបោះពុម្ព សម្រួលដល់ការផលិតមាតិកា និងកាត់បន្ថយការចំណាយយ៉ាងច្រើន។ ការបង្កើតអត្ថបទ និងសៀវភៅជាសំឡេង ដែលធ្លាប់ពឹងផ្អែកលើការជួលអ្នកសំដែងសំឡេង និងវគ្គថតរយៈពេលវែង ឥឡូវនេះអាចដំណើរការដោយស្វ័យប្រវត្តិដោយប្រើ AI voice cloning ។

នេះបង្កើនល្បឿនផលិតកម្ម និងកាត់បន្ថយថ្លៃដើមផលិត ធ្វើឱ្យអត្ថបទ និងសៀវភៅជាសំឡេងក្លាយជាជម្រើសដែលមានប្រសិទ្ធភាព និងចំណេញកាន់តែច្រើនសម្រាប់ស្ថាប័នព័ត៌មាន និងប្រព័ន្ធផ្សព្វផ្សាយ។

Hoang Ton (យោងតាម ​​IFRA)



ប្រភព

Kommentar (0)

No data
No data

ប្រធានបទដូចគ្នា

ប្រភេទដូចគ្នា

រក្សាស្មារតីនៃពិធីបុណ្យពាក់កណ្តាលសរទរដូវតាមរយៈពណ៌នៃរូបចម្លាក់
ស្វែងយល់ពីភូមិតែមួយគត់ក្នុងប្រទេសវៀតណាមក្នុងចំណោមភូមិដ៏ស្រស់ស្អាតបំផុតទាំង 50 នៅលើពិភពលោក
ហេតុអ្វី​បាន​ជា​ចង្កៀង​ទង់ជាតិ​ពណ៌​ក្រហម​ជាមួយ​តារា​ពណ៌​លឿង​ពេញ​និយម​ក្នុង​ឆ្នាំ​នេះ?
វៀតណាមឈ្នះការប្រកួតតន្ត្រី Intervision 2025

អ្នកនិពន្ធដូចគ្នា

បេតិកភណ្ឌ

រូប

អាជីវកម្ម

No videos available

ព័ត៌មាន

ប្រព័ន្ធនយោបាយ

ក្នុងស្រុក

ផលិតផល