រូបភាពនៃមេរៀន 90.png
កម្មវិធី AI គាំទ្រការធ្វើរោគវិនិច្ឆ័យរូបភាព វេជ្ជសាស្រ្ត ។ រូបថត៖ Midjourney

ការរៀបរាប់អំពីតំបន់ដែលចាប់អារម្មណ៍លើរូបភាពវេជ្ជសាស្ត្រ ដែលជាដំណើរការដែលគេស្គាល់ថាជាការបែងចែក ជារឿយៗជាជំហានដំបូងដែលក្រុមអ្នកស្រាវជ្រាវគ្លីនិកធ្វើនៅពេលធ្វើការសិក្សាថ្មីមួយពាក់ព័ន្ធនឹងរូបភាពជីវសាស្ត្រ។

ជាឧទាហរណ៍ ដើម្បីកំណត់ថាតើទំហំនៃ hippocampus របស់អ្នកជំងឺប្រែប្រួលយ៉ាងណានៅពេលពួកគេមានអាយុ អ្នកវិទ្យាសាស្ត្រ ត្រូវតែគូសផែនទីចេញ hippocampus នីមួយៗនៅក្នុងការស្កែនខួរក្បាលជាបន្តបន្ទាប់។ ដោយសាររចនាសម្ព័ន្ធ និងប្រភេទរូបភាពជាច្រើន នេះច្រើនតែជាដំណើរការសៀវភៅដៃដែលចំណាយពេលច្រើន ជាពិសេសនៅពេលដែលតំបន់ដែលចាប់អារម្មណ៍ត្រូវបានកំណត់ព្រំដែនយ៉ាងលំបាក។

ដើម្បីសម្រួលដំណើរការនេះ អ្នកស្រាវជ្រាវ MIT បានបង្កើតប្រព័ន្ធផ្អែកលើ AI ដែលអនុញ្ញាតឱ្យអ្នកវិទ្យាសាស្ត្របែងចែកសំណុំទិន្នន័យរូបភាពជីវវេជ្ជសាស្ត្រថ្មីបានយ៉ាងឆាប់រហ័សដោយចុច គូស ឬគូសប្រអប់នៅលើរូបភាព។ គំរូ AI ប្រើអន្តរកម្មទាំងនោះដើម្បីទស្សន៍ទាយការបែងចែក។

នៅពេលដែលអ្នកប្រើប្រាស់ដាក់ស្លាករូបភាពកាន់តែច្រើន ចំនួននៃអន្តរកម្មដែលត្រូវការថយចុះ ទីបំផុតធ្លាក់ចុះដល់សូន្យ។ បន្ទាប់មក ម៉ូដែលនេះអាចបែងចែករូបភាពថ្មីបានយ៉ាងត្រឹមត្រូវ ដោយមិនចាំបាច់មានការបញ្ចូលបន្ថែមពីអ្នកប្រើប្រាស់ឡើយ។

នេះអាចទៅរួច ពីព្រោះស្ថាបត្យកម្មគំរូត្រូវបានរចនាឡើងជាពិសេសដើម្បីទាញយកព័ត៌មានពីរូបភាពដែលបានបែងចែកពីមុន ដើម្បីបង្កើតការព្យាករណ៍សម្រាប់រូបភាពជាបន្តបន្ទាប់។ មិនដូចគំរូនៃការបែងចែករូបភាពវេជ្ជសាស្រ្តផ្សេងទៀត ប្រព័ន្ធនេះអនុញ្ញាតឱ្យអ្នកប្រើប្រាស់បែងចែកសំណុំទិន្នន័យទាំងមូលដោយមិនចាំបាច់ធ្វើការម្តងទៀតសម្រាប់រូបភាពនីមួយៗ។

លើសពីនេះ ឧបករណ៍អន្តរកម្មនេះមិនតម្រូវឱ្យមានសំណុំទិន្នន័យដែលបានបែងចែកជាមុនដើម្បីបណ្តុះបណ្តាលទេ ដូច្នេះអ្នកប្រើប្រាស់មិនត្រូវការជំនាញរៀនម៉ាស៊ីន ឬធនធានកុំព្យូទ័រស្មុគស្មាញទេ។ ពួកគេអាចប្រើប្រព័ន្ធសម្រាប់កិច្ចការបែងចែកថ្មីដោយមិនចាំបាច់បង្ហាត់គំរូឡើងវិញ។

ក្នុងរយៈពេលវែង ឧបករណ៍នេះអាចពន្លឿនការស្រាវជ្រាវទៅលើការព្យាបាលថ្មី និងកាត់បន្ថយការចំណាយលើការសាកល្បងព្យាបាល និងការស្រាវជ្រាវផ្នែកវេជ្ជសាស្ត្រ។ វាក៏អាចត្រូវបានប្រើដោយវេជ្ជបណ្ឌិតដើម្បីបង្កើនប្រសិទ្ធភាពនៃកម្មវិធីព្យាបាល ដូចជាការធ្វើផែនការព្យាបាលដោយវិទ្យុសកម្ម។

Hallee Wong និស្សិតថ្នាក់បណ្ឌិតផ្នែកវិស្វកម្មអគ្គិសនី និងវិទ្យាសាស្ត្រកុំព្យូទ័រ បាននិយាយថា "អ្នកវិទ្យាសាស្ត្រជាច្រើនអាចបែងចែករូបភាពពីរបីក្នុងមួយថ្ងៃប៉ុណ្ណោះសម្រាប់ការស្រាវជ្រាវរបស់ពួកគេ ពីព្រោះការបែងចែកដោយដៃគឺចំណាយពេលច្រើនពេក។

ការបង្កើនប្រសិទ្ធភាពផ្នែក

បច្ចុប្បន្នមានវិធីសាស្រ្តសំខាន់ពីរដែលអ្នកស្រាវជ្រាវប្រើដើម្បីបែងចែកសំណុំរូបភាពវេជ្ជសាស្ត្រថ្មីៗ៖

ការបែងចែកអន្តរកម្ម៖ អ្នកប្រើប្រាស់បញ្ចូលរូបភាពទៅក្នុងប្រព័ន្ធ AI ហើយសម្គាល់តំបន់ដែលចាប់អារម្មណ៍។ គំរូព្យាករណ៍ពីផ្នែកមួយដោយផ្អែកលើអន្តរកម្មទាំងនោះ។ ឧបករណ៍ដែលពីមុនត្រូវបានបង្កើតឡើងដោយក្រុម MIT គឺ ScribblePrompt អនុញ្ញាតឱ្យវាធ្វើ ប៉ុន្តែវាត្រូវតែធ្វើម្តងទៀតសម្រាប់រូបភាពថ្មីនីមួយៗ។

Task-Based Automatic Segmentation ៖ បង្កើតគំរូ AI ឯកទេសដើម្បីធ្វើការបែងចែកដោយស្វ័យប្រវត្តិ។ វិធីសាស្រ្តនេះតម្រូវឱ្យបែងចែករូបភាពរាប់រយដោយដៃដើម្បីបង្កើតសំណុំទិន្នន័យបណ្តុះបណ្តាល បន្ទាប់មកបង្ហាត់គំរូនៃការរៀនម៉ាស៊ីន។ រាល់ពេលដែលកិច្ចការថ្មីកើតឡើង អ្នកប្រើប្រាស់ត្រូវចាប់ផ្តើមដំណើរការស្មុគស្មាញទាំងមូលម្តងទៀត ហើយប្រសិនបើគំរូខុស នោះគ្មានវិធីដើម្បីកែសម្រួលវាដោយផ្ទាល់នោះទេ។

ប្រព័ន្ធថ្មី MultiverSeg រួមបញ្ចូលគ្នានូវអ្វីដែលល្អបំផុតនៃពិភពលោកទាំងពីរ។ វាទស្សន៍ទាយផ្នែកសម្រាប់រូបភាពថ្មីដោយផ្អែកលើអន្តរកម្ម (ដូចជា doodleling) ប៉ុន្តែក៏រក្សាទុករូបភាពដែលបានបែងចែកនីមួយៗទៅជាបរិបទដែលបានកំណត់សម្រាប់ឯកសារយោងនៅពេលក្រោយ។

នៅពេលដែលអ្នកប្រើប្រាស់បង្ហោះរូបថតថ្មី និងសម្គាល់ពួកវា ម៉ូដែលនេះពឹងផ្អែកលើបរិបទដែលបានកំណត់ ដើម្បីធ្វើឱ្យការទស្សន៍ទាយត្រឹមត្រូវជាងមុន ជាមួយនឹងការងារតិច។ ការរចនាស្ថាបត្យកម្មអនុញ្ញាតឱ្យមានសំណុំបរិបទនៃទំហំណាមួយដែលធ្វើឱ្យឧបករណ៍អាចបត់បែនបានសម្រាប់កម្មវិធីជាច្រើន។

លោក Wong ពន្យល់ថា "នៅចំណុចខ្លះ សម្រាប់កិច្ចការជាច្រើន អ្នកនឹងមិនចាំបាច់ផ្តល់អន្តរកម្មបន្ថែមទេ។ ប្រសិនបើមានឧទាហរណ៍គ្រប់គ្រាន់នៅក្នុងបរិបទដែលបានកំណត់ នោះគំរូអាចទស្សន៍ទាយផ្នែកបានយ៉ាងត្រឹមត្រូវដោយខ្លួនឯង" Wong ពន្យល់។

គំរូនេះត្រូវបានបណ្តុះបណ្តាលលើសំណុំទិន្នន័យចម្រុះ ដើម្បីធានាថាការព្យាករណ៍ត្រូវបានកែលម្អជាបន្តបន្ទាប់ដោយផ្អែកលើមតិកែលម្អរបស់អ្នកប្រើប្រាស់។ អ្នក​ប្រើ​មិន​ចាំ​បាច់​បង្វឹក​គំរូ​សម្រាប់​ទិន្នន័យ​ថ្មី​នោះ​ទេ - គ្រាន់​តែ​ផ្ទុក​រូបភាព​វេជ្ជសាស្រ្ដ​ថ្មី ហើយ​ចាប់​ផ្ដើម​ដាក់​ស្លាក។

នៅក្នុងការធ្វើតេស្តប្រៀបធៀបជាមួយនឹងឧបករណ៍ទំនើបផ្សេងទៀត MultiverSeg មានប្រសិទ្ធភាព និងភាពត្រឹមត្រូវជាង។

ការងារតិច លទ្ធផលកាន់តែប្រសើរ

មិនដូចឧបករណ៍ដែលមានស្រាប់ទេ MultiverSeg ទាមទារការបញ្ចូលតិចក្នុងមួយរូបភាព។ ដោយរូបភាពទី 9 វាត្រូវការការចុចតែ 2 ដងប៉ុណ្ណោះដើម្បីបង្កើតផ្នែកដែលមានភាពត្រឹមត្រូវជាងគំរូដែលកំណត់ភារកិច្ច។

ជាមួយនឹងប្រភេទរូបភាពមួយចំនួនដូចជា កាំរស្មីអ៊ិច អ្នកប្រើប្រាស់អាចគ្រាន់តែត្រូវការផ្នែករូបភាព 1-2 ដោយដៃប៉ុណ្ណោះ មុនពេលគំរូមានភាពត្រឹមត្រូវគ្រប់គ្រាន់ដើម្បីទស្សន៍ទាយនៅសល់។

អន្តរកម្មអនុញ្ញាតឱ្យអ្នកប្រើកែប្រែការទស្សន៍ទាយ ដោយធ្វើម្តងទៀតរហូតដល់ពួកគេឈានដល់ភាពត្រឹមត្រូវដែលចង់បាន។ បើប្រៀបធៀបទៅនឹងប្រព័ន្ធមុន MultiverSeg សម្រេចបាននូវភាពត្រឹមត្រូវ 90% ដោយគ្រាន់តែ 2/3 នៃការចុច និង 3/4 នៃការចុច។

Wong បានបន្ថែមថា "ជាមួយនឹង MultiverSeg អ្នកប្រើប្រាស់តែងតែអាចបន្ថែមអន្តរកម្មដើម្បីកែលម្អការព្យាករណ៍របស់ AI ។ វានៅតែបង្កើនល្បឿនដំណើរការយ៉ាងខ្លាំង ពីព្រោះការកែសម្រួលគឺលឿនជាងការចាប់ផ្តើមដំបូង" Wong បានបន្ថែម។

នៅពេលអនាគត ក្រុមការងារចង់សាកល្បងឧបករណ៍ក្នុងការអនុវត្តគ្លីនិក កែលម្អដោយផ្អែកលើមតិកែលម្អ និងពង្រីកសមត្ថភាពផ្នែករបស់វាទៅជារូបភាពជីវវេជ្ជសាស្ត្រ 3D ។

ការស្រាវជ្រាវនេះត្រូវបានគាំទ្រដោយផ្នែកដោយ Quanta Computer, Inc., វិទ្យាស្ថានសុខភាពជាតិរបស់សហរដ្ឋអាមេរិក (NIH) និងផ្នែករឹងពីមជ្ឈមណ្ឌលវិទ្យាសាស្ត្រជីវិត Massachusetts ។

(ប្រភព៖ MIT News)

ប្រភព៖ https://vietnamnet.vn/he-thong-ai-moi-ho-tro-day-nhanh-nghien-cuu-lam-sang-2450462.html