![]() |
DeepSeek telah mengeluarkan model AI baharu yang mampu memproses dokumen dengan token 7-20 kali lebih sedikit daripada kaedah tradisional. Foto: The Verge . |
Menurut SCMP , DeepSeek telah mengeluarkan model kecerdasan buatan (AI) multimodal baharu yang mampu memproses dokumen yang besar dan kompleks dengan token yang jauh lebih sedikit—7-20 kali lebih sedikit—daripada kaedah pemprosesan teks tradisional.
Token ialah unit teks terkecil yang diproses oleh AI. Mengurangkan bilangan token bermakna menjimatkan kos pengiraan dan meningkatkan kecekapan model AI.
Untuk mencapai matlamat ini, model DeepSeek-OCR (pengecaman aksara optik) menggunakan persepsi visual sebagai cara untuk memampatkan maklumat. Pendekatan ini membenarkan model bahasa yang besar untuk memproses volum besar teks tanpa menanggung kos pengiraan yang meningkat secara berkadar.
“Melalui DeepSeek-OCR, kami telah menunjukkan bahawa menggunakan persepsi visual untuk memampatkan maklumat boleh mencapai pengurangan token yang ketara—daripada 7-20 kali ganda untuk peringkat kontekstual sejarah yang berbeza—menawarkan hala tuju yang menjanjikan,” DeepSeek menyatakan.
Menurut catatan blog syarikat itu, DeepSeek-OCR terdiri daripada dua komponen utama: DeepEncoder dan DeepSeek3B-MoE-A570M, yang bertindak sebagai penyahkod.
Dalam model ini, DeepEncoder bertindak sebagai alat teras, membantu mengekalkan tahap pengaktifan rendah di bawah input resolusi tinggi sambil mencapai nisbah mampatan yang kuat untuk mengurangkan bilangan token.
Selepas itu, penyahkod ialah model Campuran Pakar (MoE) dengan 570 juta parameter, ditugaskan untuk membina semula teks asal. Seni bina MoE membahagikan model kepada subrangkaian yang pakar dalam memproses subset data input, mengoptimumkan prestasi tanpa mengaktifkan keseluruhan model.
Pada OmniDocBench, penanda aras untuk kebolehbacaan dokumen, DeepSeek-OCR mengatasi model OCR utama seperti GOT-OCR 2.0 dan MinerU 2.0, sambil menggunakan token yang jauh lebih sedikit.
Sumber: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html







Komen (0)