Vietnam.vn - Nền tảng quảng bá Việt Nam

DeepSeek znovu proráží

Společnost DeepSeek oznamuje model DeepSeek-OCR, který využívá vizuální vnímání jako kompresní médium ke zpracování velkých dokumentů s 20krát menším počtem tokenů než u tradičních metod.

ZNewsZNews23/10/2025

DeepSeek vydává nový model umělé inteligence, který dokáže zpracovávat dokumenty se 7–20krát menším počtem tokenů než tradiční metody. Foto: The Verge .

Podle serveru SCMP vydala společnost DeepSeek nový multimodální model umělé inteligence (AI), který je schopen zpracovávat velké a složité dokumenty s výrazně nižším počtem tokenů, 7–20krát méně než u tradičních metod zpracování textu.

Tokeny jsou nejmenší jednotky textu, které umělá inteligence zpracovává. Snížení počtu tokenů znamená úsporu výpočetních nákladů a zvýšení efektivity modelu umělé inteligence.

K dosažení tohoto cíle model DeepSeek-OCR (optické rozpoznávání znaků) použil vizuální vnímání jako prostředek komprese informací. Tento přístup umožňuje rozsáhlým jazykovým modelům zpracovávat obrovské objemy textu, aniž by to vynakládalo proporcionálně vyšší výpočetní náklady.

„Prostřednictvím DeepSeek-OCR jsme prokázali, že využití vizuálního vnímání ke kompresi informací může dosáhnout významného snížení počtu tokenů – 7 až 20krát pro různá historická kontextová období, což představuje slibný směr,“ uvedl DeepSeek.

Podle blogového příspěvku společnosti se DeepSeek-OCR skládá ze dvou hlavních komponent, DeepEncoderu a DeepSeek3B-MoE-A570M, který funguje jako dekodér.

Mezi nimi DeepEncoder funguje jako jádro modelu a pomáhá udržovat nízké úrovně aktivace při vstupu s vysokým rozlišením a zároveň dosahuje vysokého kompresního poměru pro snížení počtu tokenů.

Dekodér je pak model Mixture-of-Experts (MoE) s 570 miliony parametrů, který má za úkol reprodukovat původní text. Architektura MoE dělí model do podsítí, které se specializují na zpracování podmnožiny vstupních dat, a optimalizují tak výkon, aniž by bylo nutné aktivovat celý model.

V testu OmniDocBench, benchmarku čitelnosti dokumentů, DeepSeek-OCR překonává hlavní modely OCR, jako jsou GOT-OCR 2.0 a MinerU 2.0, a to i přes mnohem menší spotřebu tokenů.

Zdroj: https://znews.vn/deepseek-lai-co-dot-pha-post1595902.html


Komentář (0)

No data
No data

Dědictví

Postava

Obchod

Mladí lidé se během nejkrásnější rýžové sezóny roku vydávají na severozápad, aby se tam ubytovali.

Aktuální události

Politický systém

Místní

Produkt