ChatGPT បានឆ្លងកាត់ការវាយតម្លៃការកំណត់អត្តសញ្ញាណម៉ាស៊ីនទៅមនុស្សដ៏សំខាន់។

GPT-4.5 របស់ OpenAI ត្រូវបានចាត់ទុកថាជាប្រព័ន្ធសន្ទនា AI ដែលស្រដៀងនឹងមនុស្សបំផុតរហូតមកដល់បច្ចុប្បន្ន ដោយបើកឱកាសឱ្យប្រើប្រាស់កម្មវិធីជាច្រើនដែលមានសក្តានុពលនៅក្នុងវិស័យបញ្ញាសង្គម។

ZNews•03/04/2025

GPT-4.5 គឺជាគំរូធំបំផុតដែល OpenAI ធ្លាប់បានបង្កើត។ ប្រភព៖ The Verge ។

ការសិក្សាថ្មីមួយពីនាយកដ្ឋាន វិទ្យាសាស្ត្រ ការយល់ដឹងនៅសាកលវិទ្យាល័យកាលីហ្វ័រញ៉ា សាន់ឌីអាហ្គោ បានកត់សម្គាល់ពីព្រឹត្តិការណ៍សំខាន់មួយក្នុងវិស័យបញ្ញាសិប្បនិម្មិត៖ គំរូ GPT-4.5 របស់ OpenAI សម្រេចបាននូវដំណើរការខ្ពស់ជាងលើការធ្វើតេស្ត Turing ដោយប្រើវិធីសាស្រ្តអន្តរកម្មផ្អែកលើបុគ្គលិកលក្ខណៈ។

នេះត្រូវបានចាត់ទុកថាជាប្រព័ន្ធសន្ទនា AI ដែលស្រដៀងនឹងមនុស្សបំផុតដែលមិនធ្លាប់មាន ដែលបើកឱកាសឱ្យប្រើប្រាស់កម្មវិធីជាច្រើនដែលមានសក្តានុពលនៅក្នុងវិស័យបញ្ញាសង្គម។

OpenAI បានលើកតម្កើង GPT-4.5 ថាជា “ជំហានដ៏សំខាន់មួយក្នុងការធ្វើមាត្រដ្ឋានការបណ្តុះបណ្តាលមុន និងក្រោយការបណ្តុះបណ្តាល”។ វាគឺជាគំរូដ៏ធំបំផុតដែល OpenAI ធ្លាប់បានបង្កើត ដោយមានទំហំ និងថាមពលកុំព្យូទ័រធំជាងកំណែមុនៗយ៉ាងខ្លាំង។

យោងតាមការបង្ហោះប្លក់ផ្លូវការរបស់ OpenAI នៅថ្ងៃទី ២៧ ខែកុម្ភៈ GPT-4.5 បានចាប់ផ្តើមដាក់ឱ្យប្រើប្រាស់ដល់អ្នកប្រើប្រាស់ ChatGPT Pro ភ្លាមៗបន្ទាប់ពីការប្រកាសរបស់វា។

តើ AI អាចបញ្ឆោតមនុស្សបានទេ?

ការពិសោធន៍នេះបានប្រៀបធៀបប្រព័ន្ធ AI តំណាងចំនួនបួន៖ chatbot ELIZA ពីទសវត្សរ៍ឆ្នាំ 1960, LLaMa-3.1-405B របស់ Meta AI, GPT-4o របស់ OpenAI និង GPT-4.5។ ក្រុមស្រាវជ្រាវបានរចនាការធ្វើតេស្តឯករាជ្យពីរជាមួយអ្នកចូលរួម 250 នាក់ក្នុងមួយៗ សរុបមានអ្នកចូលរួម 500 នាក់មកពីវេទិកាអនឡាញដូចជា Prolific។ អ្នកចូលរួមមានភាពខុសប្លែកគ្នាទាំងអាយុ ភេទ និងប្រវត្តិអប់រំ ដើម្បីធានាបាននូវភាពចម្រុះនៃគំរូ។

តារាងប្រៀបធៀបនៃប្រព័ន្ធ AI ធម្មតាចំនួនបួន។ ប្រភព៖ AIbase

ការធ្វើតេស្តនេះប្រើទម្រង់ Turing ប្រពៃណី៖ អ្នកចូលរួមម្នាក់ៗចូលរួមក្នុងការសន្ទនាដែលមានមូលដ្ឋានលើអត្ថបទជាមួយបុគ្គលពីរនាក់ (មនុស្សម្នាក់ បញ្ញាសិប្បនិម្មិតម្នាក់) រយៈពេលប្រាំនាទី បន្ទាប់មកវាយតម្លៃថាអ្នកណាជាមនុស្ស។

លទ្ធផលគឺគួរឲ្យភ្ញាក់ផ្អើល៖ GPT-4.5 សម្រេចបាន "អត្រាឆ្លងកាត់ការធ្វើតេស្ត Turing" 73% ដែលលើសពីមធ្យមភាគរបស់មនុស្ស (60-70%)។ នេះគឺជាលើកដំបូងដែលគំរូ AI មួយបាន "ឆ្លងកាត់" ការធ្វើតេស្ត Turing ស្តង់ដារយ៉ាងពិតប្រាកដ។ ទន្ទឹមនឹងនេះ GPT-4o ទទួលបានពិន្ទុទាបជាងបន្តិច LLaMa-3.1-405B បានខិតជិត ឬសម្រេចបានដំណើរការរបស់មនុស្សក្នុងបរិបទខ្លះ ខណៈដែល ELIZA យឺតយ៉ាវណាស់។

សមត្ថភាពអន្តរកម្មដូចមនុស្ស

ចំណុចលេចធ្លោរបស់ GPT-4.5 មិនត្រឹមតែស្ថិតនៅក្នុងភាពស្ទាត់ជំនាញរបស់វាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងនៅក្នុងសមត្ថភាពរបស់វាក្នុងការបញ្ចេញអារម្មណ៍ និងកែតម្រូវការឆ្លើយតបទៅនឹងភាពខុសប្លែកគ្នានៃការសន្ទនាផងដែរ។ អ្នកចូលរួមជាច្រើនបានពិពណ៌នាវាថា "រួសរាយរាក់ទាក់" និង "ពិតប្រាកដ"។

ជាពិសេស នៅពេលដែលអ្នកប្រើប្រាស់មើលទៅហាក់ដូចជាមានការភ័ន្តច្រឡំ ឬតានតឹង GPT-4.5 អាចផ្តល់នូវការឆ្លើយតបបែបកំប្លែង ឬលួងលោម ដែលនាំឱ្យមនុស្សជាច្រើនជឿថាពួកគេកំពុងនិយាយជាមួយមនុស្សពិត។

ខ្លឹមសារនៃការសន្ទនារវាងប្រធានបទទាំងពីរ (បញ្ញាសិប្បនិម្មិតមួយ មនុស្សពិតម្នាក់) នៅក្នុងការធ្វើតេស្ត។ រូបថត៖ សាកលវិទ្យាល័យកាលីហ្វ័រញ៉ា សាន់ឌីអាហ្គោ ។

ទន្ទឹមនឹងនេះ ខណៈពេលដែល LLaMa-3.1-405B មានលក្ខណៈបច្ចេកទេសគួរឱ្យចាប់អារម្មណ៍ វាបង្ហាញពីការបញ្ចេញមតិអារម្មណ៍ និងសមត្ថភាពសម្របខ្លួនតាមបរិបទតិចជាងបើប្រៀបធៀបទៅនឹង GPT-4.5។ GPT-40 ទោះបីជាមានឥទ្ធិពលខ្លាំងក៏ដោយ ក៏វាខ្វះចំណុចខ្វះខាតទាក់ទងនឹងការធ្វើឱ្យមានលក្ខណៈផ្ទាល់ខ្លួន និងការកែតម្រូវការឆ្លើយតបតាមស្ថានភាព។

ការទម្លាយភាពជោគជ័យរបស់ GPT-4.5 អាចបើកឱកាសអនុវត្តជាក់ស្តែងជាច្រើន ចាប់ពីការបង្រៀនតាមអ៊ីនធឺណិត និងការគាំទ្រផ្លូវចិត្តរហូតដល់សេវាកម្មអតិថិជន។ ទោះជាយ៉ាងណាក៏ដោយ នៅពេលដែលបញ្ញាសិប្បនិម្មិត (AI) កាន់តែមានលក្ខណៈដូចមនុស្សកាន់តែខ្លាំងឡើង ការបែងចែករវាងរបស់ពិត និងរបស់និម្មិត ក៏ដូចជាការគ្រប់គ្រងរបៀបដែលបច្ចេកវិទ្យានេះត្រូវបានប្រើប្រាស់ នឹងក្លាយជាបញ្ហាប្រឈមសង្គមដ៏សំខាន់មួយ។

ការស្រាវជ្រាវនេះកើតឡើងនៅពេលដែល AI កំពុងវិវឌ្ឍឥតឈប់ឈរក្នុងល្បឿនលឿន។ ភាពជោគជ័យរបស់ GPT-4.5 មិនត្រឹមតែជាជ័យជំនះផ្នែកបច្ចេកទេសសម្រាប់ OpenAI ប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏លើកឡើងនូវសំណួរយ៉ាងស៊ីជម្រៅអំពីទំនាក់ទំនងរវាងមនុស្ស និងម៉ាស៊ីនផងដែរ។ អ្នកចូលរួមម្នាក់នៅក្នុងការពិសោធន៍នេះ បាននិយាយថា វាមានអារម្មណ៍ដូចជានិយាយជាមួយមិត្តភក្តិម្នាក់ រហូតដល់ពួកគេដឹងថាវាគ្រាន់តែជាបន្ទាត់កូដប៉ុណ្ណោះ។ ការសន្ទនារវាងមនុស្ស និង AI អាចទើបតែចាប់ផ្តើមប៉ុណ្ណោះ។

ប្រភព៖ https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html