In de context van digitale transformatie en de transformatie van kunstmatige intelligentie (AI) in Vietnam speelt OCR-technologie (optische tekenherkenning) een steeds belangrijkere rol bij het digitaliseren van documenten, het automatiseren van bedrijfsprocessen, het besparen van kosten en het verbeteren van de managementefficiëntie. Gezien de kenmerken van Vietnamezen met accenten en handschrift beperkt het herkenningsprobleem zich echter niet tot het 'lezen van woorden', maar vereist het dat het model de context volledig kan begrijpen.
Onlangs kondigde het CMC Technology Application Institute (CMC ATI) het CATI-VLM-model (Visual Document Understanding) aan, dat door het onderzoeksteam is ontwikkeld op basis van een datawarehouse van 5 TB. Het model bereikte de Top 12 in de wereld en de Top 1 in Vietnam in de ranglijst die onlangs werd bekendgemaakt door de Robust Reading Competition (RRC) in juni 2025 in de categorie Document Visual Question Answering (DocVQA).
RRC-rangschikking in DocVQA-categorie 6/2025.
De Robust Reading Competition (RRC) is een prestigieuze wetenschappelijke speeltuin (https://rrc.cvc.uab.es/), georganiseerd door het Computer Vision Center (CVC) van de Universitat Autònoma de Barcelona (UAB) in Spanje, een prestigieuze onderzoeksinstelling wereldwijd op het gebied van computer vision. De wedstrijd, die in 2011 van start ging en altijd samengaat met de International Conference on Text Analysis and Recognition (ICDAR) – een van 's werelds grootste fora voor documentanalyse en computer vision – is uitgegroeid tot een belangrijk evenement dat onderzoekers, ingenieurs van prestigieuze universiteiten, onderzoeksinstituten en technologiebedrijven zoals Tsinghua University, Hyundai Motor Group en Tencent aantrekt. De taken van de RRC zijn gericht op het bevorderen van technologische vooruitgang, die nauw verbonden is met praktische problemen van vertaling, datamanagement voor bedrijven tot stedelijke analyse en historische documentverwerking.
Dr. Dang Minh Tuan, directeur van CMC ATI, deelde: "De onderzoekscapaciteit van het CMC-team wordt bevestigd door een prestigieuze wereldwijde speeltuin als RRC. We zijn er trots op dat het team in korte tijd een hoge positie heeft bereikt en schouder aan schouder staat met grote namen uit ontwikkelde landen. Belangrijker nog, dit is een duidelijk bewijs van het vermogen om technologie te beheersen om specifieke problemen in Vietnam en specialistische vakgebieden in Vietnam op te lossen."
CATI-VLM onderscheidt zich van traditionele OCR doordat het niet alleen tekens extraheert, maar ook meerdere informatielagen begrijpt: tekstinhoud, niet-tekstuele elementen (vinkjes, diagrammen, handtekeningen, formules), lay-out (paginastructuur, tabellen, formulieren) en stijl (lettertypen, markeringen, enz.). Het model kan, net als ChatGPT, visuele vragen beantwoorden die op documentafbeeldingen worden gesteld, zonder dat er vooraf specifieke formulieren hoeven te worden geleerd.
Volgens de krant News and People
Bron: https://doanhnghiepvn.vn/cong-nghe/ai-loi-make-in-vietnam-duoc-xep-hang-top-12-the-gioi/20250703100726051


![[Foto] Da Nang: Water trekt zich geleidelijk terug, lokale autoriteiten maken gebruik van de schoonmaakactie](https://vphoto.vietnam.vn/thumb/1200x675/vietnam/resource/IMAGE/2025/10/31/1761897188943_ndo_tr_2-jpg.webp)



![[Foto] Premier Pham Minh Chinh woont de 5e Nationale Persprijzenceremonie bij, ter bestrijding van corruptie, verspilling en negativiteit](https://vphoto.vietnam.vn/thumb/1200x675/vietnam/resource/IMAGE/2025/10/31/1761881588160_dsc-8359-jpg.webp)





































































Reactie (0)