![]() |
DeepSeek mengeluarkan model AI baharu yang boleh memproses dokumen dengan token 7-20 kali lebih sedikit daripada kaedah tradisional. Foto: The Verge . |
Menurut SCMP , DeepSeek telah mengeluarkan model kecerdasan buatan (AI) pelbagai mod baharu yang mampu memproses dokumen yang besar dan kompleks dengan bilangan token yang jauh lebih rendah, 7-20 kali lebih rendah daripada kaedah pemprosesan teks tradisional.
Token ialah unit teks terkecil yang diproses oleh AI. Mengurangkan bilangan token bermakna menjimatkan kos pengiraan dan meningkatkan kecekapan model AI.
Untuk mencapai matlamat ini, model DeepSeek-OCR (pengecaman aksara optik) menggunakan persepsi visual sebagai cara pemampatan maklumat. Pendekatan ini membolehkan model bahasa besar memproses volum teks yang besar tanpa menanggung kos pengiraan yang meningkat secara berkadar.
"Melalui DeepSeek-OCR, kami telah menunjukkan bahawa menggunakan persepsi visual untuk memampatkan maklumat boleh mencapai pengurangan token yang ketara - daripada 7-20 kali untuk tempoh konteks sejarah yang berbeza, memberikan hala tuju yang menjanjikan," kata DeepSeek.
Menurut catatan blog syarikat itu, DeepSeek-OCR terdiri daripada dua komponen utama, DeepEncoder dan DeepSeek3B-MoE-A570M, yang bertindak sebagai penyahkod.
Antaranya, DeepEncoder bertindak sebagai enjin teras model, membantu mengekalkan tahap pengaktifan rendah di bawah input resolusi tinggi, sambil mencapai nisbah mampatan yang kuat untuk mengurangkan bilangan token.
Penyahkod itu kemudiannya ialah model Campuran Pakar (MoE) 570 juta parameter yang ditugaskan untuk mengeluarkan semula teks asal. Seni bina MoE membahagikan model kepada subrangkaian yang pakar dalam memproses subset data input, mengoptimumkan prestasi tanpa perlu mengaktifkan keseluruhan model.
Pada OmniDocBench, penanda aras kebolehbacaan dokumen, DeepSeek-OCR mengatasi model OCR utama seperti GOT-OCR 2.0 dan MinerU 2.0, sambil menggunakan lebih sedikit token.
Sumber: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html
Komen (0)