Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek Menerobos Lagi

DeepSeek mengumumkan model DeepSeek-OCR, yang menggunakan persepsi visual sebagai medium pemampatan untuk memproses dokumen besar dengan token sehingga 20 kali lebih sedikit daripada kaedah tradisional.

ZNewsZNews23/10/2025

DeepSeek telah mengeluarkan model AI baharu yang mampu memproses dokumen dengan token 7-20 kali lebih sedikit daripada kaedah tradisional. Foto: The Verge .

Menurut SCMP , DeepSeek telah mengeluarkan model kecerdasan buatan (AI) multimodal baharu yang mampu memproses dokumen yang besar dan kompleks dengan token yang jauh lebih sedikit—7-20 kali lebih sedikit—daripada kaedah pemprosesan teks tradisional.

Token ialah unit teks terkecil yang diproses oleh AI. Mengurangkan bilangan token bermakna menjimatkan kos pengiraan dan meningkatkan kecekapan model AI.

Untuk mencapai matlamat ini, model DeepSeek-OCR (pengecaman aksara optik) menggunakan persepsi visual sebagai cara untuk memampatkan maklumat. Pendekatan ini membenarkan model bahasa yang besar untuk memproses volum besar teks tanpa menanggung kos pengiraan yang meningkat secara berkadar.

“Melalui DeepSeek-OCR, kami telah menunjukkan bahawa menggunakan persepsi visual untuk memampatkan maklumat boleh mencapai pengurangan token yang ketara—daripada 7-20 kali ganda untuk peringkat kontekstual sejarah yang berbeza—menawarkan hala tuju yang menjanjikan,” DeepSeek menyatakan.

Menurut catatan blog syarikat itu, DeepSeek-OCR terdiri daripada dua komponen utama: DeepEncoder dan DeepSeek3B-MoE-A570M, yang bertindak sebagai penyahkod.

Dalam model ini, DeepEncoder bertindak sebagai alat teras, membantu mengekalkan tahap pengaktifan rendah di bawah input resolusi tinggi sambil mencapai nisbah mampatan yang kuat untuk mengurangkan bilangan token.

Selepas itu, penyahkod ialah model Campuran Pakar (MoE) dengan 570 juta parameter, ditugaskan untuk membina semula teks asal. Seni bina MoE membahagikan model kepada subrangkaian yang pakar dalam memproses subset data input, mengoptimumkan prestasi tanpa mengaktifkan keseluruhan model.

Pada OmniDocBench, penanda aras untuk kebolehbacaan dokumen, DeepSeek-OCR mengatasi model OCR utama seperti GOT-OCR 2.0 dan MinerU 2.0, sambil menggunakan token yang jauh lebih sedikit.

Sumber: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Komen (0)

Sila tinggalkan komen untuk berkongsi perasaan anda!

Dalam kategori yang sama

Tempat hiburan Krismas yang menimbulkan kekecohan di kalangan anak muda di Bandar Ho Chi Minh dengan pokok pain sepanjang 7m
Apakah yang terdapat dalam lorong 100m yang menyebabkan kekecohan pada Krismas?
Terharu dengan perkahwinan super yang diadakan selama 7 hari dan malam di Phu Quoc
Perarakan Kostum Purba: Seratus Bunga Kegembiraan

Daripada pengarang yang sama

Warisan

Rajah

Perniagaan

Don Den – 'balkoni langit' baharu Thai Nguyen menarik minat pemburu awan muda

Peristiwa semasa

Sistem Politik

Tempatan

produk