DeepSeek បង្ហាញពីរបៀបដែលពួកគេបង្កើតគំរូ AI ដែលមានតម្លៃទាប។ រូបថត៖ Bloomberg ។ |
នៅក្នុងរបាយការណ៍ស្រាវជ្រាវមួយដែលបានចេញផ្សាយនៅថ្ងៃទី 15 ខែឧសភា DeepSeek បានចែករំលែកជាលើកដំបូងនូវព័ត៌មានលម្អិតអំពីរបៀបដែលវាបានបង្កើតប្រព័ន្ធ AI ប្រភពបើកចំហដ៏មានឥទ្ធិពលបំផុតមួយ របស់ពិភពលោក ក្នុងតម្លៃទាបជាងដៃគូប្រកួតប្រជែងរបស់ខ្លួន។
ការសិក្សានេះ ដែលមានចំណងជើងថា “ការយល់ដឹងអំពី DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures” ត្រូវបានសរសេររួមគ្នាជាមួយស្ថាបនិក Liang Wenfeng។ DeepSeek បានសន្មតថាភាពជោគជ័យរបស់ខ្លួនគឺដោយសារតែការរចនាផ្នែករឹង និងផ្នែកទន់ស្របគ្នា ដែលជាវិធីសាស្រ្តខុសប្លែកពីក្រុមហ៊ុនជាច្រើនដែលនៅតែផ្តោតលើការបង្កើនប្រសិទ្ធភាពកម្មវិធីដោយឯករាជ្យ។
ក្រុមស្រាវជ្រាវបានសរសេរនៅក្នុងរបាយការណ៍ថា “DeepSeek-V3 ដែលត្រូវបានបណ្តុះបណ្តាលលើ GPU Nvidia H800 ចំនួន 2,048 បានបង្ហាញពីរបៀបដែលការរចនាស្របគ្នាអាចដោះស្រាយបញ្ហាប្រឈមប្រកបដោយប្រសិទ្ធភាព ដែលអាចឱ្យមានការបណ្តុះបណ្តាល និងការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាពក្នុងទ្រង់ទ្រាយធំ”។ DeepSeek និងមូលនិធិការពារហានិភ័យ High-Flyer បានស្តុកទុកបន្ទះឈីប H800 មុនពេលពួកគេត្រូវបានហាមឃាត់មិនឱ្យនាំចេញទៅកាន់ប្រទេសចិនដោយសហរដ្ឋអាមេរិកចាប់ពីឆ្នាំ 2023។
យោងតាមអត្ថបទ ក្រុមស្រាវជ្រាវ DeepSeek បានដឹងយ៉ាងច្បាស់អំពីដែនកំណត់ផ្នែករឹង និងការចំណាយហួសហេតុនៃការបណ្តុះបណ្តាលគំរូភាសាធំៗ (LLMs) ដែលជាបច្ចេកវិទ្យាមូលដ្ឋាននៅពីក្រោយ chatbots ដូចជា ChatGPT របស់ OpenAI។ ដូច្នេះ ពួកគេបានអនុវត្តការបង្កើនប្រសិទ្ធភាពបច្ចេកទេសជាបន្តបន្ទាប់ ដើម្បីបង្កើនដំណើរការអង្គចងចាំ កែលម្អការទំនាក់ទំនងរវាងបន្ទះឈីប និងបង្កើនប្រសិទ្ធភាពរួមនៃហេដ្ឋារចនាសម្ព័ន្ធ AI។
លើសពីនេះ DeepSeek សង្កត់ធ្ងន់លើតួនាទីនៃស្ថាបត្យកម្ម Mixed Expert Model (MoE)។ នេះគឺជាវិធីសាស្ត្ររៀនម៉ាស៊ីនដែលបែងចែកគំរូ AI ទៅជាបណ្តាញរង ដោយនីមួយៗដំណើរការផ្នែកដាច់ដោយឡែកនៃទិន្នន័យបញ្ចូល និងធ្វើការរួមគ្នាដើម្បីបង្កើនប្រសិទ្ធភាពលទ្ធផល។
ក្រសួងអប់រំយុវជននិងកីឡាជួយកាត់បន្ថយថ្លៃដើមបណ្តុះបណ្តាលនិងពន្លឿនល្បឿននៃការវែកញែក។ វិធីសាស្ត្រនេះឥឡូវត្រូវបានអនុម័តយ៉ាងទូលំទូលាយនៅក្នុងឧស្សាហកម្មបច្ចេកវិទ្យាចិន រួមទាំងម៉ូដែល Qwen3 ចុងក្រោយរបស់ Alibaba ផងដែរ។
DeepSeek ទទួលបានការចាប់អារម្មណ៍ជាលើកដំបូង នៅពេលដែលវាបានចេញផ្សាយម៉ូដែល V3 មូលដ្ឋានរបស់ខ្លួននៅក្នុងខែធ្នូ ឆ្នាំ២០២៤ និងម៉ូដែលហេតុផល R1 របស់ខ្លួននៅក្នុងខែមករា។ ផលិតផលទាំងនេះបានបង្កឱ្យមានការភ្ញាក់ផ្អើលនៅក្នុងទីផ្សារពិភពលោក ដែលរួមចំណែកដល់ការធ្លាក់ចុះយ៉ាងទូលំទូលាយនៃភាគហ៊ុនបច្ចេកវិទ្យាទាក់ទងនឹង AI។
ទោះបីជា DeepSeek មិនបានបង្ហាញផែនការបន្ថែមទៀតនាពេលថ្មីៗនេះក៏ដោយ ក៏វាបានរក្សាបាននូវការចាប់អារម្មណ៍ពីសហគមន៍តាមរយៈរបាយការណ៍ជាប្រចាំ។ នៅចុងខែមីនា ក្រុមហ៊ុនបានចេញផ្សាយការអាប់ដេតតិចតួចទៅ DeepSeek-V3 ហើយនៅចុងខែមេសា ពួកគេបានដាក់ឱ្យដំណើរការប្រព័ន្ធ Prover-V2 ដោយស្ងាត់ៗសម្រាប់ដំណើរការបញ្ជាក់គណិតវិទ្យា។
ប្រភព៖ https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html






Kommentar (0)