![]() |
DeepSeek heeft een nieuw AI-model uitgebracht dat documenten kan verwerken met 7 tot 20 keer minder tokens dan traditionele methoden. Foto: The Verge . |
Volgens SCMP heeft DeepSeek een nieuw multimodaal AI-model uitgebracht dat in staat is om grote en complexe documenten te verwerken met aanzienlijk minder tokens – 7 tot 20 keer minder – dan traditionele tekstverwerkingsmethoden.
Tokens zijn de kleinste teksteenheden die AI verwerkt. Het verminderen van het aantal tokens betekent een besparing op rekenkosten en een verhoging van de efficiëntie van een AI-model.
Om dit te bereiken, gebruikte het DeepSeek-OCR-model (optische tekenherkenning) visuele waarneming als middel om informatie te comprimeren. Deze aanpak stelt grote taalmodellen in staat om enorme hoeveelheden tekst te verwerken zonder dat de rekenkosten evenredig toenemen.
"Met DeepSeek-OCR hebben we aangetoond dat het gebruik van visuele waarneming om informatie te comprimeren kan leiden tot een aanzienlijke vermindering van het aantal tokens – van 7 tot 20 keer voor verschillende historische contextuele stadia – wat een veelbelovende richting biedt," aldus DeepSeek.
Volgens de blogpost van het bedrijf bestaat DeepSeek-OCR uit twee hoofdcomponenten: DeepEncoder en DeepSeek3B-MoE-A570M, die als decoder fungeert.
In dit model fungeert DeepEncoder als de kerntool, die helpt om lage activatieniveaus te behouden bij invoer met hoge resolutie, terwijl tegelijkertijd sterke compressieverhoudingen worden bereikt om het aantal tokens te verminderen.
Vervolgens is de decoder een Mixture-of-Experts (MoE)-model met 570 miljoen parameters, dat de taak heeft de oorspronkelijke tekst te reconstrueren. De MoE-architectuur verdeelt het model in subnetwerken die gespecialiseerd zijn in het verwerken van een deel van de invoergegevens, waardoor de prestaties worden geoptimaliseerd zonder het hele model te activeren.
Op OmniDocBench, een benchmark voor de leesbaarheid van documenten, presteert DeepSeek-OCR beter dan belangrijke OCR-modellen zoals GOT-OCR 2.0 en MinerU 2.0, terwijl het aanzienlijk minder tokens gebruikt.
Bron: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html







Reactie (0)