Vietnam.vn - Nền tảng quảng bá Việt Nam

A CMC a 12. helyen állt a világon szövegfelismerésben

A CMC Technology Application Institute (CMC ATI) által kifejlesztett CATI-VLM (Visual Document Understanding) modell számos nemzetközi versenytársat megelőzve bekerült a világ 12 legjobbja, Vietnámban pedig az első helyre a Robust Reading Competition (RRC) által 2025 júniusában közzétett Dokumentum Vizuális Kérdésválaszok (DocVQA) kategóriában közzétett ranglistán.

Báo Nhân dânBáo Nhân dân02/07/2025

RRC helyezés a DocVQA kategóriában 6/2025.

RRC helyezés a DocVQA kategóriában 6/2025.

A vietnami digitális átalakulás és a mesterséges intelligencia alkalmazások erőteljes átalakulása kapcsán az OCR technológia (optikai karakterfelismerés) egyre fontosabb szerepet játszik a dokumentumok digitalizálásában, az üzleti folyamatok automatizálásában, a költségek megtakarításában és a vezetési hatékonyság javításában. A vietnami akcentusok és kézírás jellemzői miatt azonban a felismerési probléma nem áll meg a „szavak olvasásakor”, hanem megköveteli, hogy a modell képes legyen átfogóan megérteni a kontextust.

A CMC Technology Application Institute (CMC ATI) nemrégiben bejelentette a CATI-VLM (Visual Document Understanding) modellt, amelyet a kutatócsoport egy 5 TB-os nagyméretű adattárházból fejlesztett ki, és számos nemzetközi versenytársat megelőzve bekerült a világ 12 legjobbja, Vietnámban pedig az első helyre a Robust Reading Competition (RRC) által 2025 júniusában kihirdetett Dokumentum Vizuális Kérdésválaszok (DocVQA) kategóriában.

A Robust Reading Competition (RRC) egy rangos tudományos játszótér (https://rrc.cvc.uab.es/), amelyet a spanyolországi Barcelonai Autonóm Egyetem (UAB) Számítógépes Látás Központja (CVC) szervez, amely a számítógépes látás területén a világ egyik rangos kutatóintézete.

A versenyt 2011-ben indították útjára, és minden évben a Nemzetközi Szövegelemzési és Felismerési Konferencia (ICDAR) keretében rendezik meg – ez a világ egyik vezető fóruma a számítógépes látás területén. A verseny számos kutatót és mérnököt vonz egyetemekről, kutatóintézetekből és olyan nagy technológiai vállalatoktól, mint a Tsinghua Egyetem, a Hyundai Motor Group, a Tencent... Az RRC feladatai a technológiai fejlődés előmozdítását célozzák, szorosan kapcsolódva a gyakorlati problémákhoz, a fordítástól, a vállalati adatkezelésen át a városi elemzésig és a történeti dokumentumok feldolgozásáig.

Dr. Dang Minh Tuan, a CMC ATI igazgatója megosztotta: „Nagy örömünkre szolgál, hogy a CMC csapat kutatási kapacitását egy olyan rangos globális helyszín is megerősítette, mint az RRC. A kutatócsoport rövid idő alatt magas rangokat ért el, bizonyítva nemzetközi versenyképességét a fejlett országok nagy neveivel szemben. Ami még fontosabb, ez egyértelműen bizonyítja, hogy képesek elsajátítani a technológiát a vietnami nyelv és a speciális területek specifikus problémáinak megoldására Vietnámban.”

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr. Dang Minh Tuan, a CMC ATI igazgatója.

A CATI-VLM abban különbözik a hagyományos OCR-től, hogy nemcsak karaktereket nyer ki, hanem több információréteget is megért: szöveges tartalmat, nem szöveges elemeket (jelölőnégyzetek, jelölőnégyzetek, diagramok, aláírások, képletek), elrendezést (oldalszerkezet, táblázatok, űrlapok) és stílust (betűtípusok, kiemelések stb.). A modell a ChatGPT-hez hasonlóan képes megválaszolni a dokumentumok képein feltett vizuális kérdéseket anélkül, hogy előzetesen meg kellene tanulni a konkrét űrlapokat.

Figyelemre méltó, hogy az RRC rangsorában a CATI-VLM mindössze 3 milliárd paraméterrel érte el a legnagyobb pontosságot 4/7 adathalmazban, megelőzve számos Big Tech modellt, mint például a Deepseek (27 milliárd paraméter), a GPT-4 Vision Turbo + Amazon Textract OCR (top 34) vagy a Baidu (top 22).

Az eredmény egyben gyakorlatias megközelítést is mutat, amely az alapvető technológia elsajátítására összpontosít, a modellt pedig a vietnami infrastrukturális feltételekhez igazítva optimalizálva a paraméterskálázás hajszolása helyett.

kép-2.jpg

Minta főiskolai felvételi jelentkezési lap

kép-3.jpg

A szöveget a fenti képen látható kézírás alapján felismerték.

Nguyen Trung Chinh, a CMC Technology Group igazgatótanácsának elnöke és ügyvezető elnöke hangsúlyozta: „Ez több mint egy évtizedes, a technológiai kutatás-fejlesztésbe (K+F) történő kitartó befektetés eredménye. A CMC nemzetközi technológiai téren elért kiemelkedő eredményei megerősítik a vietnami technológia elsajátításának stratégiáját, a mesterséges intelligencia átalakulásának és a globális piacra való belépésének orientációjával párosulva. Hisszük, hogy a vietnami hírszerzés teljes mértékben képes arra, hogy vállvetve álljon a globális Big Tech vállalatokkal, és méltó helyet foglaljon el a világ technológiai térképén.”

A CATI-VLM-et a C.OpenAI ökoszisztéma termékláncában fogják alkalmazni, beleértve a következőket: CLS virtuális asszisztens jogi dokumentumok áttekintéséhez, CMC SmartDoc - digitális dokumentumkonverziós platform, CMC KMS tudásmenedzsment rendszer, automatikus jelentéskészítő rendszer intelligens irodákhoz és új generációs Agentic Documents alkalmazások.

QUANG HUY

Forrás: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Címke: CMCCMC Corp

Hozzászólás (0)

No data
No data

Ugyanebben a témában

Ugyanebben a kategóriában

Az egymillió vietnami dongba (VND) kerülő „gazdag” virágok október 20-án is népszerűek.
Vietnami filmek és az Oscar-díjig vezető út
Fiatalok utaznak északnyugatra, hogy bejelentkezzenek az év legszebb rizsszezonjában.
A nádvadászat szezonjában Binh Lieu-ban

Ugyanattól a szerzőtől

Örökség

Ábra

Üzleti

Quang Ngai halászai naponta több millió dongot tesznek zsebre, miután garnélarákkal eltalálták a főnyereményt.

Aktuális események

Politikai rendszer

Helyi

Termék