![]() |
DeepSeek បានចេញផ្សាយគំរូ AI ថ្មីដែលមានសមត្ថភាពដំណើរការឯកសារជាមួយនឹងសញ្ញាសម្ងាត់ 7-20 ដងតិចជាងវិធីសាស្ត្រប្រពៃណី។ រូបថត៖ The Verge ។ |
យោងតាម SCMP DeepSeek បានចេញផ្សាយគំរូឆ្លាតវៃសិប្បនិម្មិតពហុមុខងារ (AI) ថ្មីដែលមានសមត្ថភាពដំណើរការឯកសារធំ និងស្មុគ្រស្មាញជាមួយនឹងសញ្ញាសម្ងាត់តិចជាង - 7-20 ដង - តិចជាងវិធីសាស្ត្រដំណើរការអត្ថបទប្រពៃណី។
Token គឺជាឯកតាតូចបំផុតនៃអត្ថបទដែល AI ដំណើរការ។ ការកាត់បន្ថយចំនួនថូខឹនមានន័យថាសន្សំការចំណាយលើការគណនា និងបង្កើនប្រសិទ្ធភាពនៃគំរូ AI ។
ដើម្បីសម្រេចបាននូវចំណុចនេះ គំរូ DeepSeek-OCR (ការទទួលស្គាល់តួអក្សរអុបទិក) បានប្រើការយល់ឃើញដែលមើលឃើញជាមធ្យោបាយនៃការបង្ហាប់ព័ត៌មាន។ វិធីសាស្រ្តនេះអនុញ្ញាតឱ្យគំរូភាសាធំ ៗ ដំណើរការបរិមាណដ៏ធំនៃអត្ថបទដោយមិនចាំបាច់ចំណាយលើការគណនាដែលកើនឡើងតាមសមាមាត្រ។
DeepSeek បាននិយាយថា "តាមរយៈ DeepSeek-OCR យើងបានបង្ហាញថាការប្រើប្រាស់ការយល់ឃើញដែលមើលឃើញដើម្បីបង្រួមព័ត៌មានអាចសម្រេចបាននូវការកាត់បន្ថយសញ្ញាសម្ងាត់សំខាន់ៗពី 7-20 ដងសម្រាប់ដំណាក់កាលបរិបទប្រវត្តិសាស្ត្រផ្សេងៗគ្នា - ផ្តល់នូវទិសដៅដ៏ជោគជ័យមួយ" DeepSeek បាននិយាយថា។
យោងតាមការបង្ហោះប្លុករបស់ក្រុមហ៊ុន DeepSeek-OCR មានសមាសភាគសំខាន់ពីរគឺ DeepEncoder និង DeepSeek3B-MoE-A570M ដែលដើរតួជាអ្នកឌិកូដ។
នៅក្នុងគំរូនេះ DeepEncoder ដើរតួជាឧបករណ៍ស្នូល ដែលជួយរក្សាកម្រិតនៃការធ្វើឱ្យសកម្មទាបក្រោមការបញ្ចូលដែលមានគុណភាពបង្ហាញខ្ពស់ ខណៈពេលដែលសម្រេចបាននូវសមាមាត្របង្ហាប់ខ្លាំង ដើម្បីកាត់បន្ថយចំនួនសញ្ញាសម្ងាត់។
ក្រោយមក ឧបករណ៍ឌិកូដគឺជាគំរូ Mixture-of-Experts (MoE) ដែលមានប៉ារ៉ាម៉ែត្រ 570 លាន ដែលមានភារកិច្ចបង្កើតអត្ថបទដើមឡើងវិញ។ ស្ថាបត្យកម្ម MoE បែងចែកគំរូទៅជាបណ្តាញរងដែលមានជំនាញក្នុងការដំណើរការសំណុំរងនៃទិន្នន័យបញ្ចូល បង្កើនប្រសិទ្ធភាពប្រតិបត្តិការដោយមិនធ្វើឱ្យម៉ូដែលទាំងមូលសកម្ម។
នៅលើ OmniDocBench ដែលជាស្តង់ដារសម្រាប់ការអានឯកសារ DeepSeek-OCR ដំណើរការជាងម៉ូដែល OCR សំខាន់ៗដូចជា GOT-OCR 2.0 និង MinerU 2.0 ខណៈពេលដែលប្រើថូខឹនតិចជាងគួរឱ្យកត់សម្គាល់។
ប្រភព៖ https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html







Kommentar (0)