យោងតាម TechCrunch មនុស្សជាច្រើនគិតថា Pokémon គឺជាការធ្វើតេស្តដ៏លំបាកបំផុតសម្រាប់បញ្ញាសិប្បនិម្មិត (AI)? ប៉ុន្តែ AI Challenge មិនទាន់ឈប់នៅទីនោះទេ ថ្មីៗនេះ អ្នកស្រាវជ្រាវនៅសកលវិទ្យាល័យ California San Diego (USA) ទើបតែចាប់ផ្តើមការប្រកួតប្រជែងថ្មីមួយជាមួយនឹងហ្គេម Super Mario Bros ដែលលទ្ធផលបង្ហាញថា មិនមែន AI ទាំងអស់អាច "ឈានដល់ទីបញ្ចប់" ដោយជោគជ័យនោះទេ។
ហ្គេម Mario កំពុងត្រូវបានប្រើដើម្បីសាកល្បងដំណើរការនៃម៉ូដែល AI ធំៗ
រូបថត៖ TECHCRUNCH SCREENSHOT
Super Mario បង្កបញ្ហាប្រឈមដ៏ធំសម្រាប់ម៉ូដែល AI
Hao AI Labs បានយក AI ចូលទៅក្នុង ពិភព Mario ដើម្បីសាកល្បងសមត្ថភាពនៃគំរូភាសាឈានមុខគេនាពេលបច្ចុប្បន្ននេះ។ លទ្ធផលបានបង្ហាញថា Claude 3.7 របស់ Anthropic ដំណើរការបានល្អបំផុត តាមពីក្រោយដោយ Claude 3.5។ ទន្ទឹមនឹងនេះដែរ Gemini 1.5 Pro របស់ Google និង GPT-4o របស់ OpenAI មានការលំបាកជាងមុនក្នុងការលេងហ្គេមដោយខ្លួនឯង។
គួរកត់សម្គាល់ថានេះមិនមែនជា Super Mario Bros ឆ្នាំ 1985 ដើមទេ។ ហ្គេមនេះដំណើរការលើកម្មវិធីត្រាប់តាម ដែលរួមបញ្ចូលជាមួយក្របខ័ណ្ឌ GamingAgent ដើម្បីអនុញ្ញាតឱ្យ AI គ្រប់គ្រង Mario តូច។ GamingAgent ផ្តល់ការណែនាំជាមូលដ្ឋានដល់ AI និងរូបថតអេក្រង់នៃហ្គេម។ បន្ទាប់មក AI បង្កើតកូដ Python ដើម្បីគ្រប់គ្រងតួអក្សរ។
យោងតាម Hao AI ហ្គេមនេះបង្ខំឱ្យម៉ូដែល "រៀន" ពីរបៀបរៀបចំផែនការចលនាស្មុគស្មាញ និងបង្កើតយុទ្ធសាស្រ្តសម្រាប់ការលេង។ គួរឱ្យចាប់អារម្មណ៍ ម៉ូដែល 'ហេតុផល' ដូចជា o1 របស់ OpenAI ដែលខ្លាំងជាងលើការធ្វើតេស្តភាគច្រើន មានការតស៊ូច្រើនជាងម៉ូដែល 'មិនសមហេតុផល' ។
ហេតុផលដែលបានផ្តល់ឱ្យគឺថាគំរូហេតុផលត្រូវការពេលវេលាដើម្បីធ្វើការសម្រេចចិត្តខណៈពេលដែល Super Mario Bros ត្រូវការការឆ្លុះបញ្ចាំងរហ័ស។ ការពន្យារពេលមួយវិនាទីអាចនាំទៅរកការបរាជ័យ។
ការប្រើប្រាស់ហ្គេមដើម្បីវាយតម្លៃ AI មានតាំងពីយូរយារណាស់មកហើយ ប៉ុន្តែអ្នកជំនាញជាច្រើនមានការសង្ស័យអំពីភាពត្រឹមត្រូវនៃវិធីសាស្ត្រនេះ។ ពួកគេប្រកែកថាហ្គេមគឺសាមញ្ញពេក ហើយផ្តល់ទិន្នន័យច្រើនពេកដើម្បីបណ្តុះបណ្តាល AI ដោយមិនឆ្លុះបញ្ចាំងពីសមត្ថភាពពិតរបស់ AI នៅក្នុងពិភពពិតនោះទេ។
Andrej Karpathy អ្នកវិទ្យាសាស្ត្រ ស្រាវជ្រាវនៅ OpenAI ហៅវាថា "វិបត្តិវាយតម្លៃ" ។
ខណៈពេលដែលការជជែកវែកញែកអំពីភាពត្រឹមត្រូវនៃការវាយតម្លៃ AI តាមរយៈហ្គេមនៅតែមាន ការមើលឃើញ AI 'ប្រយុទ្ធ' នៅក្នុងពិភពលោករបស់ Mario នៅតែជាបទពិសោធន៍ដ៏គួរឱ្យចាប់អារម្មណ៍ និងជួយមនុស្សឱ្យយល់កាន់តែច្បាស់អំពីសមត្ថភាពរបស់ AI ។
Kommentar (0)