Tongyi Lab របស់ Alibaba បានបញ្ចេញម៉ូដែល R1-Omni ជាប្រភពបើកចំហនៅថ្ងៃអង្គារ (11 មីនា) ។ នេះត្រូវបានគេចាត់ទុកថាជាគំរូភាសាពហុម៉ូឌុលដ៏ទូលំទូលាយដំបូងគេដែលអនុវត្តការសិក្សាពង្រឹងជាមួយនឹងរង្វាន់ដែលអាចផ្ទៀងផ្ទាត់បាន (RLVR) ជាបច្ចេកវិទ្យាដែលសន្យាថានឹងកែលម្អសមត្ថភាពរបស់ AI ក្នុងការវែកញែក និងវិភាគអារម្មណ៍។
ក្រុមអភិវឌ្ឍន៍បាននិយាយថាពួកគេបានប្រើ RLVR ដើម្បីបង្កើនប្រសិទ្ធភាពប្រភពបើកចំហរគំរូ HumanOmni 0.5B ដោយធ្វើអោយប្រសើរឡើងនូវកត្តាសំខាន់ៗចំនួនបី រួមទាំងសមត្ថភាពសន្និដ្ឋាន ភាពត្រឹមត្រូវក្នុងការទទួលស្គាល់អារម្មណ៍ និងសមត្ថភាពទូទៅ។ R1-Omni ត្រូវបានគេរាយការណ៍ថាអាចយល់បានកាន់តែច្បាស់ពីរបៀបដែលព័ត៌មានដែលមើលឃើញ និងសូរសព្ទជួយក្នុងការទទួលស្គាល់អារម្មណ៍ និងកំណត់កត្តាណាមួយដែលដើរតួសំខាន់ជាងក្នុងការវាយតម្លៃអារម្មណ៍នីមួយៗ។
នៅក្នុង វីដេអូ សាកល្បង R1-Omni អាចកំណត់ពីស្ថានភាពអារម្មណ៍របស់មនុស្សម្នាក់តាមរយៈវីដេអូ ក៏ដូចជាពណ៌នាអំពីសម្លៀកបំពាក់ និងជុំវិញរបស់តួអង្គផងដែរ។ នេះជាជំហានដ៏សំខាន់មួយឆ្ពោះទៅមុខក្នុងវិស័យចក្ខុវិស័យកុំព្យូទ័រ។
បច្ចេកវិទ្យាសម្គាល់អារម្មណ៍ AI កំពុងក្លាយជានិន្នាការដ៏សំខាន់មួយនៅក្នុងឧស្សាហកម្មបច្ចេកវិទ្យា។ បច្ចេកវិទ្យានេះត្រូវបានគេឃើញជាញឹកញាប់នៅក្នុងកម្មវិធីក្នុងពិភពពិត ដូចជា chatbots ជំនួយអតិថិជន ឬប្រព័ន្ធត្រួតពិនិត្យដែលរកឃើញសញ្ញានៃភាពអស់កម្លាំងរបស់អ្នកបើកបរនៅពេលបើកបររថយន្តអគ្គិសនី Tesla ។
ជាមួយនឹងការចាប់ផ្តើមនៃម៉ូដែល R1-Omni ក្រុមហ៊ុន Alibaba កំពុងបង្កើនល្បឿនក្នុងការប្រណាំង AI និងប្រជែងតំណែងរបស់ OpenAI ។ ខណៈពេលដែល OpenAI បានបើកដំណើរការ GPT-4.5 ដែលអាចទទួលស្គាល់ និងឆ្លើយតបទៅនឹងសញ្ញាដ៏ស្រទន់នៅក្នុងសំណួររបស់អ្នកប្រើប្រាស់ ក្នុងតម្លៃរហូតដល់ 200 ដុល្លារ/ខែ Alibaba ផ្តល់ជូន R1-Omni ដោយឥតគិតថ្លៃទាំងស្រុងនៅលើវេទិកា Hugging Face ។
ទោះបីជាបច្ចុប្បន្ន R1-Omni ទទួលស្គាល់តែអារម្មណ៍ជាមូលដ្ឋានដូចជា "រីករាយ" ឬ "ខឹង" ក៏ដោយ បើយោងតាមនាយកប្រតិបត្តិក្រុមហ៊ុន Alibaba លោក Wu Yongming បញ្ញាទូទៅសិប្បនិម្មិត (AGI) គឺជាគោលដៅកំពូលរបស់ក្រុមហ៊ុន ហើយការអភិវឌ្ឍន៍ភាពវៃឆ្លាតខាងអារម្មណ៍សម្រាប់ AI គឺជាជំហានឆ្ពោះទៅមុខដ៏សំខាន់មួយ។
Kommentar (0)