De AI-transformatie in Vietnam is in volle gang, OCR-technologie (optische tekenherkenning) speelt een steeds belangrijkere rol bij de digitalisering van documenten. Foto: Illustratie
Onlangs kondigde het CMC Technology Application Institute (CMC ATI) het CATI-VLM-model (Visual Document Understanding) aan, dat door het onderzoeksteam is ontwikkeld op basis van een datawarehouse van 5 TB. Het model bereikte de Top 12 in de wereld en de Top 1 in Vietnam in de ranglijst die onlangs werd bekendgemaakt door de Robust Reading Competition (RRC) in juni 2025 in de categorie Document Visual Question Answering (DocVQA).
De heer Dang Minh Tuan, directeur van CMC ATI, deelde: "We zijn erg blij dat de onderzoekscapaciteit van het CMC-team is bevestigd door een prestigieuze wereldwijde speeltuin als RRC. We zijn er trots op dat het team in korte tijd een hoge positie heeft bereikt en schouder aan schouder staat met grote namen uit ontwikkelde landen. Belangrijker nog, dit is een duidelijk bewijs van het vermogen om technologie te beheersen om specifieke problemen in Vietnam en specialistische vakgebieden in Vietnam op te lossen."
Nu de digitale transformatie en AI-transformatie in Vietnam sterk gaande zijn, speelt OCR-technologie (Optical Character Recognition) een steeds belangrijkere rol bij het digitaliseren van documenten, het automatiseren van bedrijfsprocessen, het besparen van kosten en het verbeteren van de efficiëntie van het management.
Gezien de kenmerken van het Vietnamees met accenten en handschrift, beperkt het herkenningsprobleem zich echter niet tot het 'lezen van woorden'. Het model moet de context ook volledig kunnen begrijpen.
CATI-VLM onderscheidt zich van traditionele OCR doordat het niet alleen tekens extraheert, maar ook meerdere lagen aan informatie begrijpt: tekstinhoud, niet-tekstuele elementen (vinkjes, diagrammen, handtekeningen, formules), lay-out (paginastructuur, tabellen, formulieren) en stijl (lettertypen, markeringen...).
Het model kan visuele vragen beantwoorden die op documentafbeeldingen worden gesteld, vergelijkbaar met ChatGPT, zonder dat er vooraf specifieke formulieren hoeven te worden geleerd.
De Robust Reading Competition (RRC) is een prestigieuze wetenschappelijke speeltuin, georganiseerd door het Computer Vision Center van de Universitat Autònoma de Barcelona (UAB) in Spanje, een prestigieus onderzoeksinstituut ter wereld op het gebied van computer vision.
De wedstrijd werd in 2011 voor het eerst gehouden ter gelegenheid van de Internationale Conferentie over Tekstanalyse en -herkenning (ICDAR), een van de grootste fora ter wereld op het gebied van documentanalyse en computer vision. De wedstrijd is uitgegroeid tot een belangrijk evenement dat onderzoekers, ingenieurs van prestigieuze universiteiten, onderzoeksinstituten en technologiebedrijven als Tsinghua University, Hyundai Motor Group en Tencent aantrekt.
De missie van RRC is om technologische vooruitgang te stimuleren en is gericht op echte problemen, variërend van vertaling en beheer van bedrijfsgegevens tot stedelijke analyses en verwerking van historische documenten.
Van werk tot ouderschap: hoe CEO's in de tech-sector dagelijks gebruikmaken van AIVan Jensen Huang tot Tim Cook: de machtigste CEO's in de tech-sector maken dagelijks gebruik van AI.
Bron: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
Reactie (0)