Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek Terobosan Lagi

DeepSeek mengumumkan model DeepSeek-OCR yang menggunakan persepsi visual sebagai media kompresi untuk memproses dokumen besar dengan token 20 kali lebih sedikit daripada metode tradisional.

ZNewsZNews23/10/2025

DeepSeek merilis model AI baru yang dapat memproses dokumen dengan token 7-20 kali lebih sedikit dibandingkan metode tradisional. Foto: The Verge .

Menurut SCMP , DeepSeek telah merilis model kecerdasan buatan (AI) multi-moda baru yang mampu memproses dokumen besar dan kompleks dengan jumlah token yang jauh lebih sedikit, 7-20 kali lebih sedikit daripada metode pemrosesan teks tradisional.

Token adalah unit teks terkecil yang diproses oleh AI. Mengurangi jumlah token berarti menghemat biaya komputasi dan meningkatkan efisiensi model AI.

Untuk mencapai hal ini, model DeepSeek-OCR (pengenalan karakter optik) menggunakan persepsi visual sebagai sarana kompresi informasi. Pendekatan ini memungkinkan model bahasa berukuran besar untuk memproses teks dalam jumlah besar tanpa menimbulkan biaya komputasi yang meningkat secara proporsional.

“Melalui DeepSeek-OCR, kami telah menunjukkan bahwa penggunaan persepsi visual untuk mengompresi informasi dapat menghasilkan pengurangan token yang signifikan – dari 7-20 kali lipat untuk periode konteks historis yang berbeda, memberikan arah yang menjanjikan,” kata DeepSeek.

Menurut postingan blog perusahaan, DeepSeek-OCR terdiri dari dua komponen utama, DeepEncoder dan DeepSeek3B-MoE-A570M, yang berfungsi sebagai dekoder.

Di antara semuanya, DeepEncoder bertindak sebagai mesin inti model, membantu mempertahankan tingkat aktivasi rendah di bawah masukan resolusi tinggi, sekaligus mencapai rasio kompresi yang kuat untuk mengurangi jumlah token.

Dekoder tersebut kemudian berupa model Campuran Pakar (MoE) dengan 570 juta parameter yang bertugas mereproduksi teks asli. Arsitektur MoE membagi model menjadi subjaringan yang khusus memproses sebagian data masukan, sehingga mengoptimalkan kinerja tanpa harus mengaktifkan keseluruhan model.

Pada OmniDocBench, tolok ukur keterbacaan dokumen, DeepSeek-OCR mengungguli model OCR utama seperti GOT-OCR 2.0 dan MinerU 2.0, meski menggunakan token yang jauh lebih sedikit.

Sumber: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Komentar (0)

No data
No data

Warisan

Angka

Bisnis

Anak muda pergi ke Barat Laut untuk melihat musim padi terindah tahun ini

Peristiwa terkini

Sistem Politik

Lokal

Produk