GPT-4.5 គឺជាម៉ូដែលធំបំផុតដែល OpenAI មិនធ្លាប់មាន។ ប្រភព៖ The Verge ។ |
ការសិក្សាថ្មីមួយពីនាយកដ្ឋាន វិទ្យាសាស្ត្រ ការយល់ដឹងនៅសាកលវិទ្យាល័យកាលីហ្វ័រញ៉ា សានឌីអាហ្គោ កត់សម្គាល់ពីចំណុចសំខាន់មួយក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត៖ គំរូ GPT-4.5 របស់ OpenAI ទទួលបានលទ្ធផលល្អប្រសើរលើការធ្វើតេស្ត Turing ដោយប្រើវិធីសាស្រ្តអន្តរកម្មផ្អែកលើ "បុគ្គលិកលក្ខណៈ" ។
នេះត្រូវបានគេចាត់ទុកថាជាប្រព័ន្ធសន្ទនា AI ដូចមនុស្សបំផុតមិនធ្លាប់មាន ដោយបើកកម្មវិធីដ៏មានសក្តានុពលជាច្រើនក្នុងវិស័យស៊ើបការណ៍សង្គម។
GPT-4.5 ត្រូវបានចេញវិក្កយបត្រដោយ OpenAI ថាជា "ជំហានឆ្ពោះទៅមុខដ៏សំខាន់ក្នុងការធ្វើមាត្រដ្ឋានមុនការបណ្តុះបណ្តាល និងក្រោយការបណ្តុះបណ្តាល"។ វាគឺជាគំរូដ៏ធំបំផុតដែល OpenAI មិនធ្លាប់បានសាងសង់ ជាមួយនឹងទំហំ និងថាមពលគណនាដែលលើសពីកំណែមុនៗ។
យោងតាមការបង្ហោះប្លក់ផ្លូវការរបស់ OpenAI នៅថ្ងៃទី 27 ខែកុម្ភៈ GPT-4.5 បានចាប់ផ្តើមដាក់ឱ្យប្រើប្រាស់ទៅកាន់អ្នកប្រើប្រាស់ ChatGPT Pro នៅថ្ងៃនៃការប្រកាសរបស់ខ្លួន។
AI អាចបោកមនុស្សបាន?
ការពិសោធន៍បានប្រៀបធៀបប្រព័ន្ធ AI តំណាងចំនួនបួន៖ chatbot ELIZA ឆ្នាំ 1960, Meta AI's LLaMa-3.1-405B និង OpenAI's GPT-4o និង GPT-4.5 ។ ក្រុមនេះបានរចនាការធ្វើតេស្តឯករាជ្យចំនួនពីរដោយមានអ្នកចូលរួមចំនួន 250 នាក់ក្នុងមួយៗសម្រាប់មនុស្សសរុប 500 នាក់ពីវេទិកាអនឡាញដូចជា Prolific ។ អ្នកចូលរួមមានអាយុ ភេទ និងកម្រិតអប់រំខុសៗគ្នា ដើម្បីធានាបាននូវគំរូចម្រុះ។
![]() |
តារាងប្រៀបធៀបនៃប្រព័ន្ធ AI ធម្មតាចំនួនបួន។ ប្រភព៖ AIbase |
ការធ្វើតេស្តប្រើទម្រង់ Turing ប្រពៃណី៖ អ្នកចូលរួមម្នាក់ៗជជែកតាមរយៈចំណុចប្រទាក់អត្ថបទដែលមានប្រធានបទពីរ (មនុស្សម្នាក់ AI ម្នាក់) រយៈពេល 5 នាទី បន្ទាប់មកវាយតម្លៃថាមួយណាជាមនុស្ស។
លទ្ធផលគឺគួរឱ្យភ្ញាក់ផ្អើល: GPT-4.5 សម្រេចបាននូវអត្រា "ឆ្លងកាត់ការធ្វើតេស្ត Turing" 73% លើសពីមធ្យមភាគរបស់មនុស្ស (60-70%) ។ នេះជាលើកទីមួយហើយដែលគំរូ AI បានឆ្លងផុតការធ្វើតេស្តស្តង់ដារ Turing។ ទន្ទឹមនឹងនេះដែរ GPT-4o ទទួលបានពិន្ទុទាបជាងបន្តិច LLaMa-3.1-405B បានខិតជិត ឬឈានដល់ការអនុវត្តរបស់មនុស្សនៅក្នុងបរិបទមួយចំនួន ហើយ ELIZA បានធ្លាក់ចុះឆ្ងាយ។
សមត្ថភាពក្នុងការធ្វើអន្តរកម្មដូចមនុស្ស
អ្វីដែលធ្វើឱ្យ GPT-4.5 លេចធ្លោគឺមិនត្រឹមតែភាពស្ទាត់ជំនាញក្នុងភាសាប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងសមត្ថភាពរបស់វាក្នុងការបញ្ចេញអារម្មណ៍ និងសម្របខ្លួនទៅនឹងភាពខុសប្លែកគ្នានៃការប្រាស្រ័យទាក់ទងរបស់ interlocutor ផងដែរ។ អ្នកចូលរួមជាច្រើនបានពណ៌នាថាវាជា "មិត្តភាព" និង "ពិតប្រាកដ" ។
ជាពិសេស នៅពេលដែលអ្នកប្រើមានភាពច្របូកច្របល់ ឬស្ត្រេស GPT-4.5 អាចផ្តល់នូវការឆ្លើយតបបែបកំប្លែង ឬការលួងលោម ដែលធ្វើឲ្យមនុស្សជាច្រើនជឿថាពួកគេកំពុងជជែកជាមួយមនុស្សពិត។
![]() |
ការសន្ទនារវាងមុខវិជ្ជាពីរ (AI មួយមនុស្សម្នាក់) អំឡុងពេលធ្វើតេស្ត។ រូបថត៖ UC San Diego ។ |
ទន្ទឹមនឹងនេះ LLaMa-3.1-405B ថ្វីបើមានលក្ខណៈបច្ចេកទេសគួរឱ្យចាប់អារម្មណ៍ក៏ដោយក៏មិនសូវបង្ហាញនិងប្រែប្រួលតាមបរិបទតិចជាង GPT-4.5 ។ GPT-4o ទោះបីជាមានថាមពលខ្លាំងក៏ដោយ មានលក្ខណៈអន់ជាងក្នុងលក្ខខណ្ឌនៃការកំណត់ផ្ទាល់ខ្លួន និងការសម្របខ្លួនតាមស្ថានភាព។
របកគំហើញ GPT-4.5 អាចបើកកម្មវិធីអនុវត្តជាក់ស្តែងជាច្រើន ចាប់ពីគ្រូបង្ហាត់និម្មិត រហូតដល់ជំនួយផ្នែកចិត្តសាស្រ្តដល់សេវាកម្មអតិថិជន។ ប៉ុន្តែនៅពេលដែល AI កាន់តែមានលក្ខណៈដូចមនុស្ស ការបែងចែករវាងការពិត និងការស្រមើស្រមៃ និងការគ្រប់គ្រងពីរបៀបដែលបច្ចេកវិទ្យាត្រូវបានប្រើប្រាស់នឹងក្លាយជាបញ្ហាប្រឈមដ៏សំខាន់ក្នុងសង្គម។
ការស្រាវជ្រាវនេះកើតឡើងចំពេលមានការរីកចម្រើនយ៉ាងឆាប់រហ័សក្នុង AI ។ ភាពជោគជ័យនៃ GPT-4.5 មិនត្រឹមតែជាជ័យជំនះផ្នែកបច្ចេកទេសសម្រាប់ OpenAI ប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងចោទជាសំណួរយ៉ាងជ្រាលជ្រៅអំពីទំនាក់ទំនងរវាងមនុស្ស និងម៉ាស៊ីនផងដែរ។ អ្នកសាកល្បងម្នាក់បានអធិប្បាយថា វាមានអារម្មណ៍ដូចជាគាត់កំពុងនិយាយជាមួយមិត្តម្នាក់ រហូតដល់គាត់ដឹងថាវាគ្រាន់តែជាបន្ទាត់នៃកូដប៉ុណ្ណោះ។ ការសន្ទនារវាងមនុស្ស និង AI ប្រហែលជាទើបតែចាប់ផ្តើមប៉ុណ្ណោះ។
ប្រភព៖ https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Kommentar (0)