DeepSeek បង្ហាញពីរបៀបដែលពួកគេបង្កើតគំរូ AI ថោក។ រូបថត៖ Bloomberg ។ |
នៅក្នុងរបាយការណ៍ស្រាវជ្រាវដែលបានចេញផ្សាយនៅថ្ងៃទី 15 ខែឧសភា DeepSeek បានចែករំលែកព័ត៌មានលម្អិតជាលើកដំបូងអំពីរបៀបដែលវាបង្កើតប្រព័ន្ធ AI ប្រភពបើកចំហដ៏មានឥទ្ធិពលបំផុតមួយ របស់ពិភពលោក ក្នុងតម្លៃប្រភាគនៃដៃគូប្រកួតប្រជែងរបស់ខ្លួន។
ការសិក្សានេះមានចំណងជើងថា "ការយល់ដឹងអំពី DeepSeek-V3: ការធ្វើមាត្រដ្ឋានបញ្ហាប្រឈម និងការឆ្លុះបញ្ចាំងលើផ្នែករឹងសម្រាប់ស្ថាបត្យកម្ម AI" ត្រូវបានសហការនិពន្ធដោយស្ថាបនិក Liang Wenfeng ។ DeepSeek សន្មតថាជោគជ័យរបស់ខ្លួនចំពោះការរចនាផ្នែករឹង និងសូហ្វវែរស្របគ្នា ដែលជាការផ្លាស់ប្តូរខុសពីក្រុមហ៊ុនជាច្រើនដែលផ្តោតលើការបង្កើនប្រសិទ្ធភាពកម្មវិធីនៅក្នុងភាពឯកោ។
"DeepSeek-V3 ដែលត្រូវបានបណ្តុះបណ្តាលលើ 2,048 Nvidia H800 GPUs បង្ហាញពីរបៀបដែលការរចនាប៉ារ៉ាឡែលអាចដោះស្រាយបញ្ហាប្រឈមទាំងនេះប្រកបដោយប្រសិទ្ធភាព អនុញ្ញាតឱ្យមានការបណ្តុះបណ្តាលប្រកបដោយប្រសិទ្ធភាព និងការសន្និដ្ឋានតាមមាត្រដ្ឋាន"។ DeepSeek និងមូលនិធិការពារហានិភ័យ High-Flyer បានស្តុកទុកនៅលើបណ្តាញបន្ទះឈីប H800 មុនពេលសហរដ្ឋអាមេរិកបានហាមឃាត់ការនាំចេញរបស់ពួកគេទៅកាន់ប្រទេសចិននៅឆ្នាំ 2023 ។
ក្រុមការងារ DeepSeek ដឹងពីដែនកំណត់ផ្នែករឹង និង "ការចំណាយហួសហេតុ" នៃការបណ្តុះបណ្តាលគំរូភាសាធំ (LLMs) ដែលជាបច្ចេកវិទ្យាមូលដ្ឋាននៅពីក្រោយ chatbots ដូចជា ChatGPT របស់ OpenAI បានអនុវត្តការបង្កើនប្រសិទ្ធភាពបច្ចេកទេសជាបន្តបន្ទាប់ដែលបង្កើនប្រសិទ្ធភាពនៃការចងចាំ កែលម្អទំនាក់ទំនងអន្តរបន្ទះឈីប និងបង្កើនប្រសិទ្ធភាពនៃហេដ្ឋារចនាសម្ព័ន្ធ AI ទាំងមូល។
លើសពីនេះទៀត DeepSeek សង្កត់ធ្ងន់លើតួនាទីនៃស្ថាបត្យកម្មគំរូនៃអ្នកជំនាញ (MoE) ។ នេះគឺជាវិធីសាស្រ្តរៀនម៉ាស៊ីនដែលបែងចែកគំរូ AI ទៅជាបណ្តាញរង ដែលនីមួយៗដំណើរការផ្នែកដាច់ដោយឡែកនៃទិន្នន័យបញ្ចូល ហើយធ្វើការសហការគ្នាដើម្បីបង្កើនប្រសិទ្ធភាពលទ្ធផល។
MoE កាត់បន្ថយការចំណាយលើការបណ្តុះបណ្តាល និងបង្កើនល្បឿនការសន្និដ្ឋាន។ វិធីសាស្រ្តនេះត្រូវបានទទួលយកយ៉ាងទូលំទូលាយនៅក្នុងឧស្សាហកម្មបច្ចេកវិទ្យារបស់ប្រទេសចិន រួមទាំងម៉ូដែល Qwen3 ចុងក្រោយបំផុតរបស់ក្រុមហ៊ុន Alibaba ផងដែរ។
DeepSeek បានបង្កើតចំណងជើងនៅពេលដែលវាចេញផ្សាយគំរូ V3 មូលដ្ឋានរបស់ខ្លួននៅក្នុងខែធ្នូ 2024 និងគំរូហេតុផល R1 របស់ខ្លួននៅក្នុងខែមករា។ ផលិតផលទាំងនេះបានបង្កឱ្យមានការរំជើបរំជួលនៅក្នុងទីផ្សារពិភពលោក ដែលរួមចំណែកដល់ការធ្លាក់ចុះយ៉ាងខ្លាំងនៃភាគហ៊ុនបច្ចេកវិទ្យាដែលទាក់ទងនឹង AI ។
ទោះបីជា DeepSeek មិនបានបង្ហាញពីផែនការបន្ថែមទៀតនៅក្នុងពេលថ្មីៗនេះក៏ដោយ វាបានរក្សាចំណាប់អារម្មណ៍នៅក្នុងសហគមន៍ដោយការបោះពុម្ពរបាយការណ៍ទៀងទាត់។ នៅចុងខែមីនា ក្រុមហ៊ុនបានចេញផ្សាយការអាប់ដេតបន្តិចបន្តួចចំពោះ DeepSeek-V3 ហើយនៅចុងខែមេសា វាបានបញ្ចេញប្រព័ន្ធ Prover-V2 របស់ខ្លួនស្ងាត់ៗសម្រាប់ដំណើរការភស្តុតាងគណិតវិទ្យា។
ប្រភព៖ https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html
Kommentar (0)