GPT-4.5 គឺជាម៉ូដែលធំបំផុតដែល OpenAI មិនធ្លាប់មាន។ ប្រភព៖ The Verge ។ |
ការសិក្សាថ្មីមួយពីនាយកដ្ឋាន វិទ្យាសាស្ត្រ ការយល់ដឹងនៅសាកលវិទ្យាល័យកាលីហ្វ័រញ៉ា សានឌីអាហ្គោ កត់សម្គាល់ពីចំណុចសំខាន់មួយក្នុងវិស័យបញ្ញាសិប្បនិមិត្ត៖ គំរូ GPT-4.5 របស់ OpenAI ទទួលបានលទ្ធផលល្អប្រសើរលើការធ្វើតេស្ត Turing ដោយប្រើវិធីសាស្រ្តអន្តរកម្មផ្អែកលើ "បុគ្គលិកលក្ខណៈ" ។
នេះត្រូវបានគេចាត់ទុកថាជាប្រព័ន្ធសន្ទនា AI ដូចមនុស្សបំផុតមិនធ្លាប់មាន ដោយបើកកម្មវិធីដ៏មានសក្តានុពលជាច្រើនក្នុងវិស័យស៊ើបការណ៍សង្គម។
GPT-4.5 ត្រូវបានចេញវិក្កយបត្រដោយ OpenAI ជា "ការលោតផ្លោះដ៏សំខាន់ក្នុងការធ្វើមាត្រដ្ឋានមុនការបណ្តុះបណ្តាល និងក្រោយការបណ្តុះបណ្តាល"។ វាគឺជាគំរូដ៏ធំបំផុតដែល OpenAI មិនធ្លាប់បានសាងសង់ ជាមួយនឹងទំហំ និងថាមពលគណនាដែលលើសពីកំណែមុនៗ។
យោងតាមការបង្ហោះប្លក់ផ្លូវការរបស់ OpenAI នៅថ្ងៃទី 27 ខែកុម្ភៈ GPT-4.5 បានចាប់ផ្តើមដាក់ឱ្យប្រើប្រាស់ទៅកាន់អ្នកប្រើប្រាស់ ChatGPT Pro នៅថ្ងៃនៃការប្រកាសរបស់ខ្លួន។
AI អាចបោកមនុស្សបាន?
ការពិសោធន៍បានប្រៀបធៀបប្រព័ន្ធ AI តំណាងចំនួនបួន៖ chatbot ELIZA ឆ្នាំ 1960, Meta AI's LLaMa-3.1-405B និង OpenAI's GPT-4o និង GPT-4.5 ។ ក្រុមនេះបានរចនាការធ្វើតេស្តឯករាជ្យចំនួនពីរដោយមានអ្នកចូលរួមចំនួន 250 នាក់ក្នុងមួយៗសម្រាប់មនុស្សសរុប 500 នាក់ពីវេទិកាអនឡាញដូចជា Prolific ។ អ្នកចូលរួមមានអាយុ ភេទ និងកម្រិតអប់រំខុសៗគ្នា ដើម្បីធានាបាននូវគំរូចម្រុះ។
![]() |
តារាងប្រៀបធៀបនៃប្រព័ន្ធ AI ធម្មតាចំនួនបួន។ ប្រភព៖ AIbase |
ការធ្វើតេស្តប្រើទម្រង់ Turing ប្រពៃណី៖ អ្នកចូលរួមម្នាក់ៗជជែកតាមរយៈចំណុចប្រទាក់អត្ថបទដែលមានប្រធានបទពីរ (មនុស្សម្នាក់ AI ម្នាក់) រយៈពេល 5 នាទី បន្ទាប់មកវាយតម្លៃថាមួយណាជាមនុស្ស។
លទ្ធផលគឺគួរឱ្យភ្ញាក់ផ្អើល: GPT-4.5 សម្រេចបាននូវអត្រា "ឆ្លងកាត់ការធ្វើតេស្ត Turing" រហូតដល់ 73% លើសពីមធ្យមភាគរបស់មនុស្ស (60-70%) ។ នេះជាលើកទីមួយហើយដែលគំរូ AI បានឆ្លងផុតការធ្វើតេស្តស្តង់ដារ Turing។ ទន្ទឹមនឹងនេះដែរ GPT-4o ទទួលបានពិន្ទុទាបជាងបន្តិច LLaMa-3.1-405B បានខិតជិត ឬឈានដល់ការអនុវត្តរបស់មនុស្សនៅក្នុងបរិបទមួយចំនួន ហើយ ELIZA បានធ្លាក់ចុះឆ្ងាយ។
សមត្ថភាពក្នុងការធ្វើអន្តរកម្មដូចមនុស្ស
អ្វីដែលលេចធ្លោអំពី GPT-4.5 គឺមិនត្រឹមតែភាពស្ទាត់ជំនាញក្នុងភាសាប៉ុណ្ណោះទេ ប៉ុន្តែវាក៏មានសមត្ថភាពក្នុងការបង្ហាញអារម្មណ៍ និងសម្របខ្លួនទៅនឹងការឆ្លើយតបទៅនឹងការប្រាស្រ័យទាក់ទងគ្នារបស់ interlocutor ផងដែរ។ អ្នកចូលរួមជាច្រើនបានពណ៌នាថាវាជា "មិត្តភាព" និង "ពិតប្រាកដ" ។
គួរកត់សម្គាល់ថា នៅពេលដែលអ្នកប្រើប្រាស់មានភាពច្របូកច្របល់ ឬស្ត្រេស GPT-4.5 អាចផ្តល់នូវការឆ្លើយតបបែបកំប្លែង ឬការលួងលោម ដែលនាំឱ្យមនុស្សជាច្រើនជឿថាពួកគេកំពុងជជែកជាមួយមនុស្សពិត។
![]() |
ការសន្ទនារវាងមុខវិជ្ជាពីរ (AI មួយមនុស្សម្នាក់) អំឡុងពេលធ្វើតេស្ត។ រូបថត៖ UC San Diego ។ |
ទន្ទឹមនឹងនេះ LLaMa-3.1-405B ខណៈពេលដែលគួរឱ្យចាប់អារម្មណ៍តាមបច្ចេកទេសគឺមិនសូវបង្ហាញនិងសម្របតាមបរិបទតិចជាង GPT-4.5 ។ GPT-4o ខណៈពេលដែលមានថាមពលខ្លាំងគឺទាបជាងនៅក្នុងលក្ខខណ្ឌនៃការធ្វើបដិរូបកម្ម និងការសម្របខ្លួនតាមស្ថានភាព។
របកគំហើញ GPT-4.5 អាចបើកដំណើរការកម្មវិធីជាក់ស្តែងជាច្រើន ចាប់ពីគ្រូបង្ហាត់និម្មិត រហូតដល់ជំនួយផ្នែកចិត្តសាស្រ្តដល់ការថែទាំអតិថិជន។ ទោះជាយ៉ាងណាក៏ដោយ នៅពេលដែល AI កាន់តែមានលក្ខណៈដូចមនុស្ស ការបែងចែករវាងការពិត និងនិម្មិត និងការគ្រប់គ្រងពីរបៀបប្រើប្រាស់បច្ចេកវិទ្យានេះនឹងក្លាយជាបញ្ហាប្រឈមដ៏សំខាន់ក្នុងសង្គម។
ការស្រាវជ្រាវនេះកើតឡើងចំពេលមានការរីកចម្រើនយ៉ាងឆាប់រហ័សក្នុង AI ។ ភាពជោគជ័យនៃ GPT-4.5 មិនត្រឹមតែជាជ័យជំនះផ្នែកបច្ចេកទេសសម្រាប់ OpenAI ប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងចោទជាសំណួរយ៉ាងជ្រាលជ្រៅអំពីទំនាក់ទំនងរវាងមនុស្ស និងម៉ាស៊ីនផងដែរ។ អ្នកសាកល្បងម្នាក់បានអធិប្បាយថា វាមានអារម្មណ៍ដូចជាគាត់កំពុងនិយាយជាមួយមិត្តម្នាក់ រហូតដល់គាត់ដឹងថាវាគ្រាន់តែជាបន្ទាត់នៃកូដប៉ុណ្ណោះ។ ការសន្ទនារវាងមនុស្ស និង AI ប្រហែលជាទើបតែចាប់ផ្តើមប៉ុណ្ណោះ។
ប្រភព៖ https://znews.vn/chatgpt-da-vuot-qua-bai-danh-gia-quan-trong-xac-dinh-may-nguoi-post1542945.html
Kommentar (0)