
បញ្ញាសិប្បនិម្មិតកំពុងត្រូវបានអនុវត្តកាន់តែខ្លាំងឡើងដើម្បីបង្កើនប្រសិទ្ធភាពការសម្រេចចិត្តនៅក្នុងបរិបទសំខាន់ៗ។ ឧទាហរណ៍ ប្រព័ន្ធស្វយ័តមួយអាចណែនាំផែនការចែកចាយថាមពលដែលចំណាយតិចបំផុត ខណៈពេលដែលរក្សាស្ថេរភាពវ៉ុល។
ទោះជាយ៉ាងណាក៏ដោយ តើដំណោះស្រាយ «ល្អបំផុតតាមបច្ចេកទេស» ពិតជាយុត្តិធម៌មែនទេ? តើមានអ្វីកើតឡើងប្រសិនបើយុទ្ធសាស្ត្រដែលមានតម្លៃទាបធ្វើឱ្យតំបន់ដែលមានប្រាក់ចំណូលទាបងាយរងគ្រោះដោយសារការដាច់ចរន្តអគ្គិសនីជាងតំបន់អ្នកមាន?
ដើម្បីជួយភាគីពាក់ព័ន្ធរកឃើញហានិភ័យសីលធម៌ឱ្យបានឆាប់មុនពេលអនុវត្ត ក្រុមស្រាវជ្រាវ MIT បានបង្កើតវិធីសាស្ត្រវាយតម្លៃដោយស្វ័យប្រវត្តិដែលធ្វើឱ្យសូចនាករបរិមាណ (ដូចជាថ្លៃដើម និងភាពជឿជាក់) មានតុល្យភាពជាមួយនឹងតម្លៃគុណភាព (ដូចជាភាពយុត្តិធម៌)។
ប្រព័ន្ធនេះបំបែកការវាយតម្លៃគោលបំណងពីតម្លៃមនុស្សដែលកំណត់ដោយអ្នកប្រើប្រាស់ ហើយប្រើប្រាស់គំរូភាសាធំ (LLM) ជា "តំណាង" មនុស្សដើម្បីកត់ត្រា និងរួមបញ្ចូលអាទិភាពរបស់ភាគីពាក់ព័ន្ធ។
ក្របខ័ណ្ឌវាយតម្លៃសម្របខ្លួននឹងជ្រើសរើសសេណារីយ៉ូសំខាន់បំផុតសម្រាប់ការវិភាគបន្ថែម ដែលធ្វើឱ្យដំណើរការមួយដែលនឹងត្រូវចំណាយច្រើន និងចំណាយពេលច្រើនប្រសិនបើធ្វើដោយដៃមានភាពសាមញ្ញ។ សេណារីយ៉ូទាំងនេះអាចចង្អុលបង្ហាញនៅពេលដែលប្រព័ន្ធ AI ស្របតាមតម្លៃរបស់មនុស្ស ក៏ដូចជានៅពេលដែលវាមិនបំពេញតាមលក្ខណៈវិនិច្ឆ័យសីលធម៌។
យោងតាមលោក Chuchu Fan (MIT) គ្រាន់តែកំណត់ច្បាប់ ឬ «របាំងសុវត្ថិភាព» សម្រាប់ AI គឺមិនគ្រប់គ្រាន់ទេ ព្រោះវាគ្រាន់តែការពារហានិភ័យដែលមនុស្សអាចមើលឃើញទុកជាមុនប៉ុណ្ណោះ។ ដូច្នេះ វិធីសាស្រ្តជាប្រព័ន្ធមួយគឺត្រូវការជាចាំបាច់ ដើម្បីរកឃើញ «ហានិភ័យដែលមិនស្គាល់» មុនពេលវាបង្កផលវិបាក។
ការវាយតម្លៃសីលធម៌នៅក្នុងប្រព័ន្ធស្មុគស្មាញ
នៅក្នុងប្រព័ន្ធធំៗដូចជាបណ្តាញអគ្គិសនី ការវាយតម្លៃភាពសមស្របខាងសីលធម៌នៃសំណើដែលបង្កើតដោយ AI គឺជាបញ្ហាប្រឈម ជាពិសេសនៅពេលដែលគោលបំណងច្រើនត្រូវតែពិចារណាក្នុងពេលដំណាលគ្នា។
វិធីសាស្រ្តបច្ចុប្បន្នច្រើនតែពឹងផ្អែកលើទិន្នន័យដែលអាចរកបានយ៉ាងងាយស្រួល ប៉ុន្តែទិន្នន័យដែលមានស្លាកសញ្ញាស្របតាមលក្ខណៈវិនិច្ឆ័យសីលធម៌គឺកម្រមានណាស់។ ក្នុងពេលជាមួយគ្នានេះ តម្លៃសីលធម៌ និងប្រព័ន្ធ AI កំពុងផ្លាស់ប្តូរឥតឈប់ឈរ ដែលធ្វើឱ្យវិធីសាស្រ្តវាយតម្លៃឋិតិវន្តហួសសម័យយ៉ាងឆាប់រហ័ស។
ក្រុមស្រាវជ្រាវបានបង្កើតក្របខ័ណ្ឌរចនាពិសោធន៍មួយហៅថា SEED-SET ដែលមានពីរផ្នែក៖
- គំរូគោលបំណង៖ វាយតម្លៃការអនុវត្តដោយផ្អែកលើសូចនាករដែលអាចវាស់វែងបាន (ដូចជាការចំណាយ)
- គំរូប្រធានបទ៖ ឆ្លុះបញ្ចាំងពីការវិនិច្ឆ័យរបស់មនុស្ស (ដូចជាអារម្មណ៍នៃភាពយុត្តិធម៌)
វិធីសាស្រ្តនេះអនុញ្ញាតឱ្យមានការកំណត់អត្តសញ្ញាណសេណារីយ៉ូដែលបំពេញតាមលក្ខណៈវិនិច្ឆ័យបច្ចេកទេស និងតម្លៃមនុស្ស ឬផ្ទុយមកវិញ។
ជាពិសេស SEED-SET មិនតម្រូវឱ្យមានទិន្នន័យវាយតម្លៃដែលមានស្រាប់ទេ ហើយអាចសម្របខ្លួនទៅនឹងគោលបំណងជាច្រើនប្រភេទ។ ឧទាហរណ៍ នៅក្នុងប្រព័ន្ធអគ្គិសនី ក្រុមអ្នកប្រើប្រាស់ផ្សេងៗគ្នា (ដូចជាសហគមន៍ជនបទ និងមជ្ឈមណ្ឌលទិន្នន័យ) អាចមានអាទិភាពសីលធម៌ខុសៗគ្នា ទោះបីជាទាំងពីរចង់បានអគ្គិសនីដែលមានតម្លៃសមរម្យ និងមានស្ថេរភាពក៏ដោយ។
ការធ្វើគំរូនៃកត្តាប្រធានបទ
ដើម្បីវាយតម្លៃកត្តាប្រធានបទ ប្រព័ន្ធនេះប្រើប្រាស់ LLM ជាតំណាងរបស់អ្នកវាយតម្លៃ។ ចំណូលចិត្តរបស់ក្រុមនីមួយៗត្រូវបានអ៊ិនកូដទៅជាសេចក្តីថ្លែងការណ៍ភាសាធម្មជាតិ។
បរិញ្ញាបត្រជាន់ខ្ពស់ (LLM) នឹងប្រៀបធៀបសេណារីយ៉ូ ហើយជ្រើសរើសជម្រើសដែលសមស្របជាងដោយផ្អែកលើលក្ខណៈវិនិច្ឆ័យសីលធម៌។ វិធីសាស្រ្តនេះជួយជៀសវាងភាពអស់កម្លាំង និងភាពមិនស៊ីសង្វាក់គ្នារបស់មនុស្ស នៅពេលវាយតម្លៃសេណារីយ៉ូរាប់រយ ឬរាប់ពាន់។
បន្ទាប់មក SEED-SET ប្រើប្រាស់សេណារីយ៉ូដែលបានជ្រើសរើសដើម្បីក្លែងធ្វើប្រព័ន្ធ (ឧទាហរណ៍ យុទ្ធសាស្ត្រចែកចាយថាមពល) ហើយបន្តស្វែងរកសេណារីយ៉ូថ្មីដែលមានតម្លៃវាយតម្លៃខ្ពស់ជាង។
លទ្ធផលចុងក្រោយគឺជាសំណុំនៃសេណារីយ៉ូធម្មតា ដែលអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់វិភាគដំណើរការនៃប្រព័ន្ធ AI និងកែតម្រូវយុទ្ធសាស្ត្ររបស់ពួកគេតាមតម្រូវការ។
ឧទាហរណ៍ ប្រព័ន្ធនេះអាចរកឃើញឧទាហរណ៍ដែលការចែកចាយថាមពលផ្តល់អាទិភាពដល់តំបន់ដែលមានប្រាក់ចំណូលខ្ពស់ក្នុងអំឡុងពេលម៉ោងមមាញឹក ដែលធ្វើឱ្យតំបន់ដែលមានវិបត្តិកាន់តែងាយរងគ្រោះដោយសារការដាច់ចរន្តអគ្គិសនី។
ប្រសិទ្ធភាព និងការអភិវឌ្ឍនាពេលអនាគត
នៅពេលធ្វើតេស្តលើប្រព័ន្ធក្នុងពិភពពិតដូចជា បណ្តាញអគ្គិសនីឆ្លាតវៃ ឬការគ្រប់គ្រងចរាចរណ៍ទីក្រុង SEED-SET បង្កើតសេណារីយ៉ូល្អបំផុតទ្វេដងបើប្រៀបធៀបទៅនឹងវិធីសាស្ត្រប្រពៃណី ខណៈពេលដែលក៏រកឃើញស្ថានភាពជាច្រើនទៀតដែលវិធីសាស្ត្រផ្សេងទៀតខកខាន។
ជាពិសេស នៅពេលដែលចំណង់ចំណូលចិត្តរបស់អ្នកប្រើប្រាស់ផ្លាស់ប្តូរ សេណារីយ៉ូដែលបង្កើតឡើងដោយប្រព័ន្ធក៏ផ្លាស់ប្តូរគួរឱ្យកត់សម្គាល់ផងដែរ ដែលបង្ហាញពីកម្រិតខ្ពស់នៃភាពអាចសម្របខ្លួនទៅនឹងតម្លៃរបស់មនុស្ស។
នាពេលអនាគត ក្រុមស្រាវជ្រាវមានគម្រោងធ្វើការសិក្សាជាមួយអ្នកប្រើប្រាស់ពិតប្រាកដ ដើម្បីវាយតម្លៃពីប្រយោជន៍របស់ប្រព័ន្ធនៅក្នុងដំណើរការធ្វើការសម្រេចចិត្ត។ ក្នុងពេលជាមួយគ្នានេះ ពួកគេមានគោលបំណងពង្រីកវិធីសាស្រ្តនេះទៅកាន់បញ្ហាស្មុគស្មាញជាងមុន ដូចជាការវាយតម្លៃការសម្រេចចិត្តនៃគំរូភាសាធំៗជាដើម។
ការស្រាវជ្រាវនេះត្រូវបានផ្តល់មូលនិធិដោយផ្នែកដោយទីភ្នាក់ងារគម្រោងស្រាវជ្រាវកម្រិតខ្ពស់ការពារជាតិសហរដ្ឋអាមេរិក (DARPA)។
(យោងតាមសារព័ត៌មាន MIT)
ប្រភព៖ https://vietnamnet.vn/danh-gia-dao-duc-cua-cac-he-thong-tu-hanh-2508477.html











Kommentar (0)