Tongyi Lab របស់ក្រុមហ៊ុន Alibaba កាលពីថ្ងៃអង្គារ (11 មីនា) បានចេញផ្សាយប្រភពបើកចំហ R1-Omni ដែលជាគំរូភាសាពហុមុខងារដំបូងគេបង្អស់ដែលប្រើការរៀនពង្រឹងជាមួយនឹងរង្វាន់ដែលអាចផ្ទៀងផ្ទាត់បាន (RLVR) ដែលជាបច្ចេកវិទ្យាដែលសន្យាថានឹងធ្វើឱ្យប្រសើរឡើងនូវសមត្ថភាពរបស់ AI ក្នុងការវែកញែក និងវិភាគអារម្មណ៍។
ក្រុមបាននិយាយថាពួកគេបានប្រើ RLVR ដើម្បីបង្កើនប្រសិទ្ធភាពនៃប្រភពបើកចំហរគំរូ HumanOmni 0.5B ដោយធ្វើអោយប្រសើរឡើងយ៉ាងខ្លាំងនូវមាត្រដ្ឋានសំខាន់ៗចំនួនបី៖ ការសន្និដ្ឋាន ភាពត្រឹមត្រូវនៃការទទួលស្គាល់អារម្មណ៍ និងការធ្វើទូទៅ។ យោងតាមរបាយការណ៍ R1-Omni អាចយល់កាន់តែច្បាស់អំពីរបៀបដែលព័ត៌មានដែលមើលឃើញ និងសូរសព្ទគាំទ្រដល់ការទទួលស្គាល់អារម្មណ៍ និងកំណត់យ៉ាងច្បាស់ថាកត្តាណាដែលមានតួនាទីសំខាន់ជាងក្នុងការវាយតម្លៃអារម្មណ៍នីមួយៗ។
នៅក្នុង វីដេអូ សាកល្បង R1-Omni អាចកំណត់ពីស្ថានភាពអារម្មណ៍របស់មនុស្សម្នាក់តាមរយៈវីដេអូ ក៏ដូចជាពណ៌នាអំពីសម្លៀកបំពាក់ និងជុំវិញរបស់តួអង្គផងដែរ។ នេះជាជំហានដ៏សំខាន់មួយឆ្ពោះទៅមុខក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។
បច្ចេកវិទ្យាសម្គាល់អារម្មណ៍ AI កំពុងក្លាយជានិន្នាការដ៏សំខាន់នៅក្នុងឧស្សាហកម្មបច្ចេកវិទ្យា។ បច្ចេកវិទ្យានេះត្រូវបានគេមើលឃើញជាញឹកញាប់នៅក្នុងកម្មវិធីជាក់ស្តែងដូចជា chatbots ជំនួយអតិថិជន ឬប្រព័ន្ធត្រួតពិនិត្យដែលរកឃើញសញ្ញានៃភាពអស់កម្លាំងរបស់អ្នកបើកបរនៅពេលបើកបររថយន្តអគ្គិសនី Tesla ។
ជាមួយនឹងការចាប់ផ្តើមនៃម៉ូដែល R1-Omni ក្រុមហ៊ុន Alibaba កំពុងពន្លឿនការប្រណាំង AI និងប្រជែងតំណែងរបស់ OpenAI ។ ខណៈពេលដែល OpenAI បានបើកដំណើរការ GPT-4.5 ដែលអាចទទួលស្គាល់ និងឆ្លើយតបទៅនឹងសញ្ញាដ៏ស្រទន់នៅក្នុងសំណួររបស់អ្នកប្រើប្រាស់ ក្នុងតម្លៃរហូតដល់ 200 ដុល្លារ/ខែ Alibaba ផ្តល់ជូន R1-Omni ដោយឥតគិតថ្លៃទាំងស្រុងនៅលើវេទិកា Hugging Face ។
ទោះបីជាបច្ចុប្បន្ន R1-Omni ទទួលស្គាល់តែអារម្មណ៍ជាមូលដ្ឋានដូចជា "រីករាយ" ឬ "ខឹង" ក៏ដោយ បើយោងតាមនាយកប្រតិបត្តិក្រុមហ៊ុន Alibaba លោក Wu Yongming បញ្ញាទូទៅសិប្បនិម្មិត (AGI) គឺជាគោលដៅកំពូលរបស់ក្រុមហ៊ុន ហើយការអភិវឌ្ឍន៍ភាពវៃឆ្លាតខាងអារម្មណ៍សម្រាប់ AI គឺជាជំហានឆ្ពោះទៅមុខដ៏សំខាន់មួយ។
Kommentar (0)