![]() |
DeepSeek បញ្ចេញគំរូ AI ថ្មីដែលអាចដំណើរការឯកសារជាមួយនឹងសញ្ញាសម្ងាត់ 7-20 ដងតិចជាងវិធីសាស្ត្រប្រពៃណី។ រូបថត៖ The Verge ។ |
យោងតាម SCMP DeepSeek បានចេញផ្សាយគំរូបញ្ញាសិប្បនិម្មិតពហុម៉ូឌុល (AI) ថ្មីដែលមានសមត្ថភាពដំណើរការឯកសារធំនិងស្មុគស្មាញជាមួយនឹងចំនួនថូខឹនទាបជាងយ៉ាងខ្លាំង តិចជាង 7-20 ដងនៃវិធីសាស្ត្រដំណើរការអត្ថបទប្រពៃណី។
Token គឺជាឯកតាតូចបំផុតនៃអត្ថបទដែល AI ដំណើរការ។ ការកាត់បន្ថយចំនួនថូខឹនមានន័យថាសន្សំការចំណាយលើការគណនា និងបង្កើនប្រសិទ្ធភាពនៃគំរូ AI ។
ដើម្បីសម្រេចបាននូវចំណុចនេះ គំរូ DeepSeek-OCR (ការទទួលស្គាល់តួអក្សរអុបទិក) បានប្រើការយល់ឃើញដែលមើលឃើញជាមធ្យោបាយនៃការបង្ហាប់ព័ត៌មាន។ វិធីសាស្រ្តនេះអនុញ្ញាតឱ្យគំរូភាសាធំដើម្បីដំណើរការបរិមាណដ៏ធំនៃអត្ថបទដោយមិនចាំបាច់ចំណាយលើការគណនាដែលកើនឡើងតាមសមាមាត្រ។
DeepSeek បាននិយាយថា "តាមរយៈ DeepSeek-OCR យើងបានបង្ហាញថាការប្រើប្រាស់ការយល់ឃើញដែលមើលឃើញដើម្បីបង្រួមព័ត៌មានអាចសម្រេចបាននូវការកាត់បន្ថយសញ្ញាសម្ងាត់សំខាន់ៗពី 7-20 ដងសម្រាប់រយៈពេលបរិបទប្រវត្តិសាស្ត្រផ្សេងៗគ្នាដែលផ្តល់នូវទិសដៅដ៏ជោគជ័យមួយ" DeepSeek បាននិយាយថា។
យោងតាមការបង្ហោះប្លុករបស់ក្រុមហ៊ុន DeepSeek-OCR មានសមាសភាគសំខាន់ពីរគឺ DeepEncoder និង DeepSeek3B-MoE-A570M ដែលដើរតួជាអ្នកឌិកូដ។
ក្នុងចំនោមពួកគេ DeepEncoder ដើរតួជាម៉ាស៊ីនស្នូលនៃម៉ូដែលនេះ ជួយរក្សាកម្រិតនៃការធ្វើឱ្យសកម្មទាបក្រោមការបញ្ចូលគុណភាពបង្ហាញខ្ពស់ ខណៈពេលដែលសម្រេចបាននូវសមាមាត្របង្ហាប់ខ្លាំងដើម្បីកាត់បន្ថយចំនួនសញ្ញាសម្ងាត់។
បន្ទាប់មកឧបករណ៍ឌិកូដគឺជាគំរូ Mixture-of-Experts (MoE) ដែលមានប៉ារ៉ាម៉ែត្រ 570 លានដែលមានភារកិច្ចក្នុងការផលិតអត្ថបទដើមឡើងវិញ។ ស្ថាបត្យកម្ម MoE បែងចែកគំរូទៅជាបណ្តាញរងដែលមានជំនាញក្នុងការដំណើរការសំណុំរងនៃទិន្នន័យបញ្ចូល បង្កើនប្រសិទ្ធភាពប្រតិបត្តិការដោយមិនចាំបាច់ធ្វើឱ្យគំរូទាំងមូលសកម្ម។
នៅលើ OmniDocBench ដែលជាស្តង់ដារនៃការអានឯកសារ DeepSeek-OCR ដំណើរការជាងម៉ូដែល OCR សំខាន់ៗដូចជា GOT-OCR 2.0 និង MinerU 2.0 ខណៈពេលដែលប្រើថូខឹនតិចជាងច្រើន។
ប្រភព៖ https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
Kommentar (0)