Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek heeft opnieuw een doorbraak bereikt.

DeepSeek heeft het DeepSeek-OCR-model aangekondigd, dat visuele waarneming als compressiemethode gebruikt om grote documenten te verwerken met tot wel 20 keer minder tokens dan traditionele methoden.

ZNewsZNews23/10/2025

DeepSeek heeft een nieuw AI-model uitgebracht dat documenten kan verwerken met 7 tot 20 keer minder tokens dan traditionele methoden. Foto: The Verge .

Volgens SCMP heeft DeepSeek een nieuw multimodaal AI-model uitgebracht dat in staat is om grote en complexe documenten te verwerken met aanzienlijk minder tokens – 7 tot 20 keer minder – dan traditionele tekstverwerkingsmethoden.

Tokens zijn de kleinste teksteenheden die AI verwerkt. Het verminderen van het aantal tokens betekent een besparing op rekenkosten en een verhoging van de efficiëntie van een AI-model.

Om dit te bereiken, gebruikte het DeepSeek-OCR-model (optische tekenherkenning) visuele waarneming als middel om informatie te comprimeren. Deze aanpak stelt grote taalmodellen in staat om enorme hoeveelheden tekst te verwerken zonder dat de rekenkosten evenredig toenemen.

"Met DeepSeek-OCR hebben we aangetoond dat het gebruik van visuele waarneming om informatie te comprimeren kan leiden tot een aanzienlijke vermindering van het aantal tokens – van 7 tot 20 keer voor verschillende historische contextuele stadia – wat een veelbelovende richting biedt," aldus DeepSeek.

Volgens de blogpost van het bedrijf bestaat DeepSeek-OCR uit twee hoofdcomponenten: DeepEncoder en DeepSeek3B-MoE-A570M, die als decoder fungeert.

In dit model fungeert DeepEncoder als de kerntool, die helpt om lage activatieniveaus te behouden bij invoer met hoge resolutie, terwijl tegelijkertijd sterke compressieverhoudingen worden bereikt om het aantal tokens te verminderen.

Vervolgens is de decoder een Mixture-of-Experts (MoE)-model met 570 miljoen parameters, dat de taak heeft de oorspronkelijke tekst te reconstrueren. De MoE-architectuur verdeelt het model in subnetwerken die gespecialiseerd zijn in het verwerken van een deel van de invoergegevens, waardoor de prestaties worden geoptimaliseerd zonder het hele model te activeren.

Op OmniDocBench, een benchmark voor de leesbaarheid van documenten, presteert DeepSeek-OCR beter dan belangrijke OCR-modellen zoals GOT-OCR 2.0 en MinerU 2.0, terwijl het aanzienlijk minder tokens gebruikt.

Bron: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Reactie (0)

Laat een reactie achter om je gevoelens te delen!

In dezelfde categorie

Een kerstattractie in Ho Chi Minh-stad zorgt voor opschudding onder jongeren dankzij een 7 meter hoge dennenboom.
Wat is er in het 100m-steegje dat tijdens Kerstmis voor opschudding zorgt?
Overweldigd door de superbruiloft die 7 dagen en nachten in Phu Quoc plaatsvond
Oude kostuumparade: vreugde van honderd bloemen

Van dezelfde auteur

Erfenis

Figuur

Bedrijf

Don Den – Thai Nguyens nieuwe ‘hemelbalkon’ trekt jonge wolkenjagers aan

Actuele gebeurtenissen

Politiek systeem

Lokaal

Product