Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek បង្ហាញអាថ៌កំបាំងរបស់វា។

DeepSeek បានបង្ហាញជាលើកដំបូងអំពីរបៀបដែលវាបានបង្កើតគំរូ AI ប្រភពបើកចំហឈានមុខគេរបស់ពិភពលោកក្នុងតម្លៃទាប ដោយសារការរចនាផ្នែករឹង និងផ្នែកទន់ក្នុងពេលដំណាលគ្នា។

ZNewsZNews19/05/2025

DeepSeek បង្ហាញពីរបៀបដែលពួកគេបង្កើតគំរូ AI ដែលមានតម្លៃទាប។ រូបថត៖ Bloomberg

នៅក្នុងរបាយការណ៍ស្រាវជ្រាវមួយដែលបានចេញផ្សាយនៅថ្ងៃទី 15 ខែឧសភា DeepSeek បានចែករំលែកជាលើកដំបូងនូវព័ត៌មានលម្អិតអំពីរបៀបដែលវាបានបង្កើតប្រព័ន្ធ AI ប្រភពបើកចំហដ៏មានឥទ្ធិពលបំផុតមួយ របស់ពិភពលោក ក្នុងតម្លៃទាបជាងដៃគូប្រកួតប្រជែងរបស់ខ្លួន។

ការសិក្សានេះ ដែលមានចំណងជើងថា “ការយល់ដឹងអំពី DeepSeek-V3: Scaling Challenges and Reflections on Hardware for AI Architectures” ត្រូវបានសរសេររួមគ្នាជាមួយស្ថាបនិក Liang Wenfeng។ DeepSeek បានសន្មតថាភាពជោគជ័យរបស់ខ្លួនគឺដោយសារតែការរចនាផ្នែករឹង និងផ្នែកទន់ស្របគ្នា ដែលជាវិធីសាស្រ្តខុសប្លែកពីក្រុមហ៊ុនជាច្រើនដែលនៅតែផ្តោតលើការបង្កើនប្រសិទ្ធភាពកម្មវិធីដោយឯករាជ្យ។

ក្រុមស្រាវជ្រាវបានសរសេរនៅក្នុងរបាយការណ៍ថា “DeepSeek-V3 ដែលត្រូវបានបណ្តុះបណ្តាលលើ GPU Nvidia H800 ចំនួន 2,048 បានបង្ហាញពីរបៀបដែលការរចនាស្របគ្នាអាចដោះស្រាយបញ្ហាប្រឈមប្រកបដោយប្រសិទ្ធភាព ដែលអាចឱ្យមានការបណ្តុះបណ្តាល និងការសន្និដ្ឋានប្រកបដោយប្រសិទ្ធភាពក្នុងទ្រង់ទ្រាយធំ”។ DeepSeek និងមូលនិធិការពារហានិភ័យ High-Flyer បានស្តុកទុកបន្ទះឈីប H800 មុនពេលពួកគេត្រូវបានហាមឃាត់មិនឱ្យនាំចេញទៅកាន់ប្រទេសចិនដោយសហរដ្ឋអាមេរិកចាប់ពីឆ្នាំ 2023។

យោងតាមអត្ថបទ ក្រុមស្រាវជ្រាវ DeepSeek បានដឹងយ៉ាងច្បាស់អំពីដែនកំណត់ផ្នែករឹង និងការចំណាយហួសហេតុនៃការបណ្តុះបណ្តាលគំរូភាសាធំៗ (LLMs) ដែលជាបច្ចេកវិទ្យាមូលដ្ឋាននៅពីក្រោយ chatbots ដូចជា ChatGPT របស់ OpenAI។ ដូច្នេះ ពួកគេបានអនុវត្តការបង្កើនប្រសិទ្ធភាពបច្ចេកទេសជាបន្តបន្ទាប់ ដើម្បីបង្កើនដំណើរការអង្គចងចាំ កែលម្អការទំនាក់ទំនងរវាងបន្ទះឈីប និងបង្កើនប្រសិទ្ធភាពរួមនៃហេដ្ឋារចនាសម្ព័ន្ធ AI។

លើសពីនេះ DeepSeek សង្កត់ធ្ងន់លើតួនាទីនៃស្ថាបត្យកម្ម Mixed Expert Model (MoE)។ នេះគឺជាវិធីសាស្ត្ររៀនម៉ាស៊ីនដែលបែងចែកគំរូ AI ទៅជាបណ្តាញរង ដោយនីមួយៗដំណើរការផ្នែកដាច់ដោយឡែកនៃទិន្នន័យបញ្ចូល និងធ្វើការរួមគ្នាដើម្បីបង្កើនប្រសិទ្ធភាពលទ្ធផល។

ក្រសួង​អប់រំ​យុវជន​និង​កីឡា​ជួយ​កាត់​បន្ថយ​ថ្លៃ​ដើម​បណ្តុះបណ្តាល​និង​ពន្លឿន​ល្បឿន​នៃ​ការ​វែកញែក។ វិធីសាស្ត្រ​នេះ​ឥឡូវ​ត្រូវ​បាន​អនុម័ត​យ៉ាង​ទូលំទូលាយ​នៅ​ក្នុង​ឧស្សាហកម្ម​បច្ចេកវិទ្យា​ចិន រួម​ទាំង​ម៉ូដែល Qwen3 ចុង​ក្រោយ​របស់ Alibaba ផង​ដែរ។

DeepSeek ទទួលបានការចាប់អារម្មណ៍ជាលើកដំបូង នៅពេលដែលវាបានចេញផ្សាយម៉ូដែល V3 មូលដ្ឋានរបស់ខ្លួននៅក្នុងខែធ្នូ ឆ្នាំ២០២៤ និងម៉ូដែលហេតុផល R1 របស់ខ្លួននៅក្នុងខែមករា។ ផលិតផលទាំងនេះបានបង្កឱ្យមានការភ្ញាក់ផ្អើលនៅក្នុងទីផ្សារពិភពលោក ដែលរួមចំណែកដល់ការធ្លាក់ចុះយ៉ាងទូលំទូលាយនៃភាគហ៊ុនបច្ចេកវិទ្យាទាក់ទងនឹង AI។

ទោះបីជា DeepSeek មិនបានបង្ហាញផែនការបន្ថែមទៀតនាពេលថ្មីៗនេះក៏ដោយ ក៏វាបានរក្សាបាននូវការចាប់អារម្មណ៍ពីសហគមន៍តាមរយៈរបាយការណ៍ជាប្រចាំ។ នៅចុងខែមីនា ក្រុមហ៊ុនបានចេញផ្សាយការអាប់ដេតតិចតួចទៅ DeepSeek-V3 ហើយនៅចុងខែមេសា ពួកគេបានដាក់ឱ្យដំណើរការប្រព័ន្ធ Prover-V2 ដោយស្ងាត់ៗសម្រាប់ដំណើរការបញ្ជាក់គណិតវិទ្យា។

ប្រភព៖ https://znews.vn/deepseek-tiet-lo-bi-mat-post1554222.html


Kommentar (0)

សូមអធិប្បាយដើម្បីចែករំលែកអារម្មណ៍របស់អ្នក!

ប្រភេទដូចគ្នា

អ្នកនិពន្ធដូចគ្នា

បេតិកភណ្ឌ

រូប

អាជីវកម្ម

ព្រឹត្តិការណ៍បច្ចុប្បន្ន

ប្រព័ន្ធនយោបាយ

ក្នុងស្រុក

ផលិតផល

Happy Vietnam
វៀតណាម - ប្រទេស - ប្រជាជន

វៀតណាម - ប្រទេស - ប្រជាជន

ទីធ្លាសាលារៀននៅថ្ងៃទី 30 ខែមេសា

ទីធ្លាសាលារៀននៅថ្ងៃទី 30 ខែមេសា

តាមរយៈសាខា និងប្រវត្តិសាស្ត្រ

តាមរយៈសាខា និងប្រវត្តិសាស្ត្រ