Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek znovu proráží

Společnost DeepSeek oznámila model DeepSeek-OCR, který využívá vizuální vnímání jako kompresní médium ke zpracování velkých dokumentů s až 20krát menším počtem tokenů než u tradičních metod.

ZNewsZNews23/10/2025

Společnost DeepSeek vydala nový model umělé inteligence schopný zpracovávat dokumenty se 7–20krát menším počtem tokenů než u tradičních metod. Foto: The Verge .

Podle serveru SCMP vydala společnost DeepSeek nový multimodální model umělé inteligence (AI), který je schopen zpracovávat velké a složité dokumenty s výrazně menším počtem tokenů – 7–20krát méně – než u tradičních metod zpracování textu.

Tokeny jsou nejmenší jednotky textu, které umělá inteligence zpracovává. Snížení počtu tokenů znamená úsporu výpočetních nákladů a zvýšení efektivity modelu umělé inteligence.

K dosažení tohoto cíle model DeepSeek-OCR (optické rozpoznávání znaků) použil vizuální vnímání jako prostředek komprese informací. Tento přístup umožňuje rozsáhlým jazykovým modelům zpracovávat obrovské objemy textu, aniž by to vynakládalo proporcionálně rostoucí výpočetní náklady.

„Prostřednictvím DeepSeek-OCR jsme prokázali, že využití vizuálního vnímání ke kompresi informací může dosáhnout významného snížení počtu tokenů – 7 až 20krát pro různé historické kontextové fáze – což nabízí slibný směr,“ uvedl DeepSeek.

Podle blogového příspěvku společnosti se DeepSeek-OCR skládá ze dvou hlavních komponent: DeepEncoder a DeepSeek3B-MoE-A570M, který funguje jako dekodér.

V tomto modelu funguje DeepEncoder jako základní nástroj, který pomáhá udržovat nízké úrovně aktivace při vstupu s vysokým rozlišením a zároveň dosahuje silných kompresních poměrů pro snížení počtu tokenů.

Dekodér následně využívá model Mixture-of-Experts (MoE) s 570 miliony parametrů, jehož úkolem je rekonstruovat původní text. Architektura MoE rozděluje model do podsítí, které se specializují na zpracování podmnožiny vstupních dat, čímž optimalizují výkon bez aktivace celého modelu.

V OmniDocBench, benchmarku pro čitelnost dokumentů, DeepSeek-OCR překonává hlavní modely OCR, jako jsou GOT-OCR 2.0 a MinerU 2.0, a to i přesto, že používá výrazně méně tokenů.

Zdroj: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Komentář (0)

Zanechte komentář a podělte se o své pocity!

Ve stejné kategorii

Vánoční zábavní místo, které v Ho Či Minově Městě vyvolalo mezi mladými lidmi rozruch díky sedmimetrové borovici
Co se nachází v uličce dlouhé 100 metrů, která o Vánocích způsobuje rozruch?
Ohromen super svatbou, která se konala 7 dní a nocí na Phu Quoc.
Starověký kostýmní průvod: Radost ze stovky květin

Od stejného autora

Dědictví

Postava

Obchod

Don Den – Thai Nguyenův nový „nebeský balkon“ láká mladé lovce mraků

Aktuální události

Politický systém

Místní

Produkt