Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

CMC bereikt wereldtop 12 in tekstherkenning

Het CATI-VLM-model (Visual Document Understanding) dat is ontwikkeld door het CMC Technology Application Institute (CMC ATI) heeft vele internationale concurrenten overtroffen en behoort nu tot de top 12 ter wereld en de top 1 in Vietnam in de ranglijst die onlangs werd bekendgemaakt door de Robust Reading Competition (RRC) in juni 2025 in de categorie Document Visual Question Answering (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

RRC-rangschikking in DocVQA-categorie 6/2025.

RRC-rangschikking in DocVQA-categorie 6/2025.

In de context van digitale transformatie en de transformatie van kunstmatige intelligentie in Vietnam speelt OCR-technologie (Optical Character Recognition) een steeds belangrijkere rol bij het digitaliseren van documenten, het automatiseren van bedrijfsprocessen, het besparen van kosten en het verbeteren van de managementefficiëntie. Gezien de kenmerken van Vietnamezen met accenten en handschrift beperkt het herkenningsprobleem zich echter niet tot het 'lezen van woorden', maar vereist het dat het model de context volledig kan begrijpen.

Onlangs kondigde het CMC Technology Application Institute (CMC ATI) het CATI-VLM-model (Visual Document Understanding) aan. Dit model is door het onderzoeksteam ontwikkeld op basis van een datawarehouse van 5 TB. Daarmee heeft het model veel internationale concurrenten overtroffen en behoort het tot de top 12 ter wereld en de top 1 in Vietnam in de ranglijst die onlangs in juni 2025 door de Robust Reading Competition (RRC) is bekendgemaakt in de categorie Document Visual Question Answering (DocVQA).

Robust Reading Competition (RRC) is een prestigieuze wetenschappelijke speeltuin (https://rrc.cvc.uab.es/), georganiseerd door het Computer Vision Center (CVC) van de Universitat Autònoma de Barcelona (UAB) in Spanje, een prestigieus onderzoeksinstituut ter wereld op het gebied van computer vision.

De wedstrijd werd in 2011 in het leven geroepen en vindt jaarlijks plaats in het kader van de International Conference on Text Analysis and Recognition (ICDAR) – een van 's werelds toonaangevende fora op het gebied van computer vision. De wedstrijd trekt een groot aantal onderzoekers en ingenieurs van universiteiten, onderzoeksinstituten en grote technologiebedrijven zoals Tsinghua University, Hyundai Motor Group en Tencent... De problemen van RRC zijn ontworpen om technologische vooruitgang te bevorderen en zijn nauw verbonden met praktische problemen van vertaling, datamanagement tot stedelijke analyse en verwerking van historische documenten.

Dr. Dang Minh Tuan, directeur van CMC ATI, deelde: "We zijn erg blij dat de onderzoekscapaciteit van het CMC-team is bevestigd door een prestigieuze wereldwijde speeltuin als RRC. In korte tijd heeft het onderzoeksteam hoge posities behaald, wat zijn internationale concurrentiepositie ten opzichte van grote namen uit ontwikkelde landen aantoont. Belangrijker nog, dit is een duidelijk bewijs van het vermogen om technologie te beheersen om specifieke problemen in Vietnam en specialistische vakgebieden in Vietnam op te lossen."

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr. Dang Minh Tuan, directeur van CMC ATI.

CATI-VLM onderscheidt zich van traditionele OCR doordat het niet alleen tekens extraheert, maar ook meerdere informatielagen begrijpt: tekstinhoud, niet-tekstuele elementen (vinkjes, diagrammen, handtekeningen, formules), lay-out (paginastructuur, tabellen, formulieren) en stijl (lettertypen, markeringen, enz.). Het model kan, net als ChatGPT, visuele vragen beantwoorden die op documentafbeeldingen worden gesteld, zonder dat er vooraf specifieke formulieren hoeven te worden geleerd.

Opvallend is dat CATI-VLM in de RRC-ranglijst met slechts 3 miljard parameters de hoogste nauwkeurigheid behaalde in 4/7-datasets. Daarmee overtrof het veel Big Tech-modellen zoals Deepseek (27 miljard parameters), GPT-4 Vision Turbo + Amazon Textract OCR (top 34) of Baidu (top 22).

Deze prestatie is ook een bewijs van een praktische aanpak, waarbij de nadruk ligt op het beheersen van de kerntechnologie en het optimaliseren van het model om het aan te laten sluiten bij de infrastructuuromstandigheden in Vietnam, in plaats van het najagen van parameterschaal.

afbeelding-2.jpg

Voorbeeld van een aanmeldingsformulier voor toelating tot een universiteit

afbeelding-3.jpg

In de afbeelding hierboven is handschriftelijke tekst herkend.

De heer Nguyen Trung Chinh, voorzitter van de raad van bestuur en uitvoerend voorzitter van CMC Technology Group, benadrukte: "Dit is het resultaat van meer dan een decennium aanhoudende investeringen in technologisch onderzoek en ontwikkeling (R&D). De hoge prestaties van CMC op het internationale technologieterrein bevestigen de strategie om Vietnamese technologie te beheersen, in combinatie met de oriëntatie op AI-transformatie en het betreden van de wereldmarkt. Wij zijn ervan overtuigd dat de Vietnamese inlichtingendienst volledig in staat is om schouder aan schouder te staan ​​met wereldwijde Big Tech en een waardige positie op de wereldkaart van technologie te verwerven."

CATI-VLM wordt toegepast in de productketen van het C.OpenAI-ecosysteem, waaronder: CLS virtuele assistent voor het beoordelen van juridische documenten, CMC SmartDoc - digitaal documentconversieplatform, CMC KMS kennisbeheersysteem, automatisch rapportagesysteem voor slimme kantoren en nieuwe generatie Agentic Documents-toepassingen.

QUANG HUY

Bron: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Reactie (0)

No data
No data

In hetzelfde onderwerp

In dezelfde categorie

2 miljard TikTok-weergaven noemde Le Hoang Hiep: de populairste soldaat van A50 tot A80
Soldaten nemen emotioneel afscheid van Hanoi na meer dan 100 dagen missie A80
Ho Chi Minhstad 's nachts zien schitteren met lichtjes
Met een langdradig afscheid namen de inwoners van de hoofdstad afscheid van de A80-soldaten die Hanoi verlieten.

Van dezelfde auteur

Erfenis

Figuur

Bedrijf

No videos available

Nieuws

Politiek systeem

Lokaal

Product