ដោយប្រើបច្ចេកទេសធ្វើឱ្យប្រសើរឡើងពីការបណ្តុះបណ្តាល AI របស់ DeepSeek បន្ទះឈីប Huawei Ascend បានផ្តល់នូវដំណើរការដ៏អស្ចារ្យ។ រូបថត៖ រ៉យទ័រ ។ |
SCMP បានរាយការណ៍ថា អ្នកស្រាវជ្រាវដែលធ្វើការលើគំរូភាសាដ៏ធំ Pangu (LLM) របស់ក្រុមហ៊ុន Huawei បានប្រកាសនៅថ្ងៃទី 4 ខែមិថុនាថាពួកគេបានធ្វើឱ្យប្រសើរឡើងនូវវិធីសាស្រ្តដើមរបស់ DeepSeek ក្នុងការបណ្តុះបណ្តាលបញ្ញាសិប្បនិម្មិត (AI) ដោយប្រើប្រាស់ផ្នែករឹងដែលមានកម្មសិទ្ធិរបស់ក្រុមហ៊ុន។
ជាពិសេស ក្រដាសដែលបោះពុម្ពដោយក្រុម Pangu របស់ Huawei ដែលរួមមានអ្នកសហការស្នូលចំនួន 22 នាក់ និងអ្នកស្រាវជ្រាវបន្ថែមចំនួន 56 នាក់ បានណែនាំគំនិតនៃ Mixture of Grouped Experts (MoGE) ដែលជាកំណែអាប់ដេតនៃបច្ចេកទេស Mixture of Experts (MoE) ដែលដើរតួនាទីយ៉ាងសំខាន់នៅក្នុងម៉ូដែល AI ដ៏មានប្រសិទ្ធភាពរបស់ DeepSeek ។
យោងតាមក្រដាស ខណៈពេលដែល MoE ផ្តល់នូវការចំណាយទាបនៃការអនុវត្តសម្រាប់ប៉ារ៉ាម៉ែត្រគំរូធំ និងសមត្ថភាពសិក្សាកម្រិតខ្ពស់ វាក៏ជារឿយៗនាំទៅរកភាពគ្មានប្រសិទ្ធភាពផងដែរ។ នេះមកពីការធ្វើឱ្យសកម្មមិនស្មើគ្នា ដែលរារាំងដំណើរការនៅពេលដំណើរការលើឧបករណ៍ជាច្រើនស្របគ្នា។
ទន្ទឹមនឹងនេះ MoGE ត្រូវបានកែលម្អដោយក្រុមអ្នកជំនាញក្នុងដំណើរការជ្រើសរើស និងធ្វើឱ្យមានតុល្យភាពការងាររបស់ "អ្នកជំនាញ" កាន់តែប្រសើរឡើង នេះបើយោងតាមអ្នកស្រាវជ្រាវ។
នៅក្នុងការបណ្តុះបណ្តាល AI ពាក្យ "អ្នកជំនាញ" សំដៅលើម៉ូដែលរងឯកទេស ឬសមាសធាតុនៅក្នុងគំរូធំជាង។ គំរូនីមួយៗទាំងនេះនឹងត្រូវបានរចនាឡើងដើម្បីដោះស្រាយភារកិច្ចជាក់លាក់ ឬប្រភេទទិន្នន័យផ្សេងៗគ្នា។ នេះអនុញ្ញាតឱ្យប្រព័ន្ធទាំងមូលប្រើជំនាញចម្រុះដើម្បីកែលម្អការអនុវត្ត។
យោងតាមក្រុមហ៊ុន Huawei ដំណើរការបណ្តុះបណ្តាលមានបីដំណាក់កាលសំខាន់ៗ៖ ការបណ្តុះបណ្តាលមុន ការពង្រីកបរិបទវែង និងការបណ្តុះបណ្តាលក្រោយការបណ្តុះបណ្តាល។ ដំណើរការទាំងមូលរួមមានការបណ្តុះបណ្តាលជាមុនលើសញ្ញាសម្ងាត់ 13.2 ពាន់ពាន់លាន និងការពង្រីកបរិបទវែងដោយប្រើបន្ទះឈីប Ascend ចំនួន 8,192 ដែលជាប្រព័ន្ធដំណើរការ AI ដ៏មានឥទ្ធិពលបំផុតរបស់ Huawei ដែលប្រើដើម្បីបណ្តុះបណ្តាលម៉ូដែល AI និងមានបំណងប្រកួតប្រជែងលើភាពលេចធ្លោរបស់ Nvidia នៅក្នុងការរចនាបន្ទះឈីបកម្រិតខ្ពស់។
តាមរយៈការសាកល្បងស្ថាបត្យកម្មថ្មីនៅលើ Ascend neural processing unit (NPU) ដែលត្រូវបានរចនាឡើងជាពិសេសដើម្បីពន្លឿនការងារ AI អ្នកស្រាវជ្រាវបានរកឃើញថា MoGE "បណ្តាលឱ្យមានតុល្យភាពបន្ទុករបស់អ្នកជំនាញកាន់តែប្រសើរ និងការអនុវត្តកាន់តែមានប្រសិទ្ធភាពសម្រាប់ទាំងការបណ្តុះបណ្តាលគំរូ និងការសន្និដ្ឋាន" ។
ជាលទ្ធផល បើប្រៀបធៀបជាមួយនឹងម៉ូដែលដូចជា DeepSeek-V3, Qwen2.5-72B របស់ Alibaba និង Meta Platforms 'Llama-405B, Pangu ដំណើរការលើសពីស្តង់ដារភាសាអង់គ្លេសទូទៅភាគច្រើន និងស្តង់ដារចិនទាំងអស់ ដែលបង្ហាញពីដំណើរការល្អប្រសើរក្នុងការបណ្តុះបណ្តាលបរិបទវែង។
ប្រភព៖ https://znews.vn/huawei-tuyen-bo-huan-luyen-ai-tot-hon-deepseek-post1558359.html
Kommentar (0)