DeepSeek កំពុងផ្តោតលើការស្រាវជ្រាវ និងការអភិវឌ្ឍនៃម៉ូដែលថ្មី ជាជាងការលេចឡើងច្រើននៅក្នុងប្រព័ន្ធផ្សព្វផ្សាយ។ រូបថត៖ SCMP ។ |
ដោយមានកិច្ចសហការជាមួយអ្នកស្រាវជ្រាវមកពីសាកលវិទ្យាល័យ Tsinghua, DeepSeek បានណែនាំវិធីសាស្រ្តថ្មីមួយដើម្បីកែលម្អសមត្ថភាព inference នៃគំរូភាសាធំ (LLMs) ។ វិធីសាស្រ្តដែលត្រូវបានបោះពុម្ពផ្សាយនៅក្នុងឯកសារស្រាវជ្រាវដែលបានចេញផ្សាយនៅថ្ងៃទី 4 ខែមេសា ជួយ LLMs បង្កើតលទ្ធផលកាន់តែប្រសើរ និងលឿនជាងមុនសម្រាប់សំណួរទូទៅ។
បច្ចេកទេសនេះគឺជាការរួមបញ្ចូលគ្នានៃវិធីសាស្រ្តជោគជ័យពីរមុនរបស់ DeepSeek ។ មួយគឺគំរូរង្វាន់ទូទៅ (GRM) ដែលអនុញ្ញាតឱ្យគំរូ AI វាយតម្លៃដោយខ្លួនឯង និងកែលម្អចម្លើយរបស់វាដោយផ្អែកលើលទ្ធផលមុន ហើយមួយទៀតគឺការកែតម្រូវការរិះគន់ដោយគោលការណ៍ខ្លួនឯង។
វិធីសាស្រ្តទាំងពីរនេះពឹងផ្អែកលើធាតុ "ការរៀនដោយខ្លួនឯង" នៃ AI ដោយកាត់បន្ថយការពឹងផ្អែកលើមតិយោបល់ផ្ទាល់ ឬការណែនាំរបស់មនុស្ស ប៉ុន្តែជាមួយនឹងបំណងប្រាថ្នាដើម្បីបង្កើតលទ្ធផលកាន់តែជិតទៅនឹងការរំពឹងទុករបស់មនុស្ស។
យោងតាមក្រុមអ្នកស្រាវជ្រាវ ថ្វីត្បិតតែជាវិធីសាស្រ្តថ្មីក៏ដោយ DeepSeek-GRM នៅតែទទួលបានលទ្ធផលល្អ និងប្រកួតប្រជែងជាមួយនឹងម៉ូដែល AI ដ៏ល្បីល្បាញ និងមានប្រសិទ្ធភាពបំផុតនាពេលបច្ចុប្បន្ននេះ។ DeepSeek គ្រោងនឹងបើកប្រភពម៉ូដែល GRM របស់ខ្លួន ប៉ុន្តែមិនទាន់បានកំណត់ពេលវេលាជាក់លាក់នៅឡើយទេ។
បន្ទាប់ពីបានបង្កើតការភ្ញាក់ផ្អើលជាសកលជាមួយនឹងគំរូវេទិកា V3 និងគំរូការសន្និដ្ឋាន R1 របស់ខ្លួន DeepSeek បានបោះពុម្ពផ្សាយអត្ថបទសិក្សានេះនៅលើឃ្លាំង វិទ្យាសាស្ត្រ អនឡាញ arXiv ដោយទុកឱ្យមនុស្សជាច្រើនចង់ដឹងអំពីការផ្លាស់ប្តូរបន្ទាប់របស់ក្រុមហ៊ុន។
Reuters បានព្យាករណ៍ថា DeepSeek-R2 ដែលជាអ្នកស្នងតំណែងរបស់ R1 អាចនឹងត្រូវបានដាក់ឱ្យដំណើរការនៅខែមេសា ដោយសារម៉ូដែលមុនៗមិនទាន់ត្រជាក់នៅឡើយ។ កាលពីមុន DeepSeek-R1 បានធ្វើឱ្យពិភពបច្ចេកវិទ្យាពិភពលោកភ្ញាក់ផ្អើល ដោយសារដំណើរការដ៏ល្អឥតខ្ចោះរបស់វា បើធៀបនឹងតម្លៃ ប្រកួតប្រជែងគ្រប់គ្រាន់ជាមួយនឹងម៉ូដែលឈានមុខគេនាពេលបច្ចុប្បន្ននេះ។
DeepSeek រក្សាភាពស្ងៀមស្ងាត់ចំពោះការរំពឹងទុក។ ទោះជាយ៉ាងណាក៏ដោយ យោងតាមព័ត៌មានក្នុងស្រុក គណនីថែទាំអតិថិជន DeepSeek បានបដិសេធព័ត៌មានខាងលើនៅក្នុងក្រុមជជែកជាមួយអតិថិជនសាជីវកម្ម។
បង្កើតឡើងនៅទីក្រុង Hangzhou ក្នុងឆ្នាំ 2023 ដោយសហគ្រិន Liang Wenfeng ក្រុមហ៊ុន DeepSeek បានទាក់ទាញចំណាប់អារម្មណ៍ទូទាំងពិភពលោកយ៉ាងឆាប់រហ័សក្នុងរយៈពេលប៉ុន្មានខែចុងក្រោយនេះ។ ប៉ុន្តែជំនួសឱ្យការបោះទុនលើកិត្តិនាមសាធារណៈ ក្រុមហ៊ុនបានផ្តោតលើធនធានរបស់ខ្លួនលើការស្រាវជ្រាវ និងការអភិវឌ្ឍន៍។
កាលពីមុន DeepSeek បានដំឡើងកំណែម៉ូដែល V3 ដោយបើកដំណើរការកំណែ DeepSeek-V3-0324 ។ យោងតាមការប្រកាស ការអាប់ដេតនេះមានលក្ខណៈពិសេសការពង្រឹងសមត្ថភាពសន្និដ្ឋាន ការបង្កើនប្រសិទ្ធភាពសម្រាប់ការអភិវឌ្ឍន៍គេហទំព័រផ្នែកខាងមុខ និងការកែលម្អការសរសេរភាសាចិន។
នៅក្នុងខែកុម្ភៈ ការចាប់ផ្តើមដំណើរការក៏បើកប្រភពកូដចំនួនប្រាំផងដែរ ដោយបញ្ជាក់ពីការប្តេជ្ញាចិត្តរបស់ខ្លួនក្នុងការ "ដំណើរការប្រកបដោយតម្លាភាពពេញលេញ"។ នៅក្នុងខែនេះផងដែរ ក្រុមហ៊ុនបានបោះពុម្ពផ្សាយឯកសារបច្ចេកទេសមួយស្តីពី "ការយកចិត្តទុកដាក់តិចតួចពីកំណើត" ដែលធ្វើអោយប្រសើរឡើងនូវដំណើរការរបស់ LLMs ក្នុងដំណើរការទិន្នន័យយ៉ាងច្រើន។
DeepSeek ត្រូវបានគេមើលឃើញថាជានិមិត្តសញ្ញានៃភាពធន់នៃឧស្សាហកម្ម AI របស់ប្រទេសចិន ចំពេលមានការខិតខំប្រឹងប្រែងរបស់សហរដ្ឋអាមេរិកក្នុងការទប់ស្កាត់ការអភិវឌ្ឍន៍បច្ចេកវិទ្យារបស់ប្រទេស។
ប្រភព៖ https://znews.vn/deepseek-gay-to-mo-post1543900.html
Kommentar (0)