
គំរូកាន់តែរឹងមាំ «ការគិត» កាន់តែខ្សោយ?
នៅក្នុងរបាយការណ៍ដែលទើបចេញផ្សាយថ្មីៗនេះ ក្រុមអ្នកស្រាវជ្រាវ Apple បានវាយតម្លៃពីដំណើរការរបស់គំរូហេតុផលធំៗ (LRMs) ក្នុងការដោះស្រាយបញ្ហាតក្កវិជ្ជាដែលមានការលំបាកកើនឡើង ដូចជា ប៉ម ហាណូយ ឬបញ្ហា ឆ្លងកាត់ទន្លេ ។
លទ្ធផលគឺគួរឱ្យភ្ញាក់ផ្អើលណាស់៖ នៅពេលប្រឈមមុខនឹងបញ្ហាស្មុគស្មាញខ្លាំង ភាពត្រឹមត្រូវនៃគំរូ AI កម្រិតខ្ពស់មិនត្រឹមតែធ្លាក់ចុះប៉ុណ្ណោះទេ ថែមទាំង "ដួលរលំទាំងស្រុង" ទៀតផង។
អ្វីដែលគួរឲ្យព្រួយបារម្ភជាងនេះទៅទៀតនោះគឺថា មុនពេលដែលការអនុវត្តធ្លាក់ចុះយ៉ាងខ្លាំង គំរូទាំងនោះបានចាប់ផ្តើម... កាត់បន្ថយការខិតខំប្រឹងប្រែងវែកញែករបស់ពួកគេ ដែលជាឥរិយាបថផ្ទុយពីវិចារណញាណ ព្រោះការគិតបន្ថែមទៀតគួរតែត្រូវបានទាមទារនៅពេលដោះស្រាយបញ្ហាដ៏លំបាកមួយ។
ក្នុងករណីជាច្រើន សូម្បីតែពេលផ្តល់ក្បួនដោះស្រាយត្រឹមត្រូវក៏ដោយ គំរូទាំងនោះនៅតែមិនអាចផ្តល់ដំណោះស្រាយបានទេ។ នេះបង្ហាញពីដែនកំណត់យ៉ាងជ្រាលជ្រៅនៅក្នុងសមត្ថភាពរបស់ពួកគេក្នុងការសម្របខ្លួន និងអនុវត្តច្បាប់នៅក្នុងបរិស្ថានថ្មី។
បញ្ហាប្រឈមនៃ "ទ្រឹស្តីទូទៅ"
ឆ្លើយតបទៅនឹងការស្រាវជ្រាវនេះ អ្នកប្រាជ្ញអាមេរិក Gary Marcus ដែលជាសំឡេងមួយរូបដែលមានការសង្ស័យអំពីសមត្ថភាពពិតរបស់ AI បានហៅការរកឃើញរបស់ Apple ថា "គួរឱ្យរន្ធត់ណាស់"។
នៅក្នុងព្រឹត្តិប័ត្រព័ត៌មាន Substack ផ្ទាល់ខ្លួនរបស់គាត់ គាត់បាននិយាយថា "អ្នកណាដែលគិតថាគំរូភាសាធំៗ (LLMs) គឺជាផ្លូវផ្ទាល់ទៅកាន់ AGI កំពុងតែបញ្ឆោតខ្លួនឯង"។
ដោយយល់ស្របនឹងទស្សនៈនេះ លោក Andrew Rogoyski អ្នកជំនាញនៅវិទ្យាស្ថាន AI ដែលផ្តោតលើមនុស្ស (សាកលវិទ្យាល័យ Surrey ចក្រភពអង់គ្លេស) ជឿជាក់ថាការរកឃើញនេះចង្អុលបង្ហាញពីលទ្ធភាពដែលឧស្សាហកម្មបច្ចេកវិទ្យាកំពុងឆ្ពោះទៅរក "ផ្លូវទាល់"៖ "នៅពេលដែលគំរូដំណើរការបានល្អតែជាមួយបញ្ហាសាមញ្ញ និងកម្រិតលំបាកមធ្យម ប៉ុន្តែបរាជ័យទាំងស្រុងនៅពេលកម្រិតលំបាកកើនឡើង វាច្បាស់ណាស់ថាមានបញ្ហាជាមួយវិធីសាស្រ្តបច្ចុប្បន្ន"។
ចំណុចជាក់លាក់មួយដែលក្រុមហ៊ុន Apple បានបង្ហាញគឺកង្វះសមត្ថភាព "វែកញែកទូទៅ" ពោលគឺសមត្ថភាពក្នុងការពង្រីកការយល់ដឹងពីស្ថានភាពជាក់លាក់មួយទៅស្ថានភាពស្រដៀងគ្នា។
នៅពេលដែលចំណេះដឹងមិនអាចផ្ទេរបានតាមរបៀបដែលមនុស្សធ្វើជាធម្មតា គំរូបច្ចុប្បន្នងាយនឹងធ្លាក់ចូលទៅក្នុងស្ថានភាព "ការរៀនដោយទន្ទេញចាំ"៖ ខ្លាំងក្នុងគំរូដដែលៗ ប៉ុន្តែខ្សោយក្នុងការគិតឡូជីខល ឬការសន្និដ្ឋាន។
លើសពីនេះ ការស្រាវជ្រាវបានរកឃើញថា គំរូវែកញែកទ្រង់ទ្រាយធំប្រើប្រាស់ធនធានកុំព្យូទ័រដោយអនុវត្តជំហានត្រឹមត្រូវម្តងហើយម្តងទៀតសម្រាប់បញ្ហាសាមញ្ញៗ ប៉ុន្តែជ្រើសរើសវិធីសាស្រ្តខុសតាំងពីដំបូងសម្រាប់បញ្ហាស្មុគស្មាញជាងបន្តិច។
របាយការណ៍នេះបានសាកល្បងម៉ូដែលឈានមុខគេជាច្រើន រួមមាន OpenAI's o3, Google's Gemini Thinking, Claude 3.7 Sonnet-Thinking និង DeepSeek-R1។ ខណៈពេលដែល Anthropic, Google និង DeepSeek មិនទាន់បានឆ្លើយតបនៅឡើយទេ OpenAI បានបដិសេធមិនធ្វើអត្ថាធិប្បាយ។
ការស្រាវជ្រាវរបស់ក្រុមហ៊ុន Apple មិនបានបដិសេធសមិទ្ធផលរបស់ AI ក្នុងភាសា រូបភាព ឬទិន្នន័យធំៗនោះទេ។ ទោះជាយ៉ាងណាក៏ដោយ វាបង្ហាញពីចំណុចខ្វាក់មួយដែលត្រូវបានមើលរំលង៖ សមត្ថភាពក្នុងការវែកញែកដោយស្មោះត្រង់ ដែលជាស្នូលនៃការសម្រេចបាននូវភាពវៃឆ្លាតពិតប្រាកដ។
ប្រភព៖ https://baovanhoa.vn/nhip-song-so/ai-suy-luan-kem-dan-khi-gap-bai-toan-phuc-tap-141602.html







Kommentar (0)