AI-transformationen i Vietnam sker starkt, OCR-teknik (optisk teckenigenkänning) spelar en allt viktigare roll i digitalisering av dokument. Foto: Illustration
Nyligen tillkännagav CMC Technology Application Institute (CMC ATI) CATI-VLM-modellen (Visual Document Understanding), som utvecklats av forskarteamet från ett stort datalager på 5 TB. Modellen nådde topp 12 i världen och topp 1 i Vietnam i rankningen som just tillkännagavs av Robust Reading Competition (RRC) i juni 2025 i kategorin Document Visual Question Answering (DocVQA).
Dang Minh Tuan, chef för CMC ATI, delade: "Vi är mycket glada över att CMC-teamets forskningskapacitet har bekräftats genom en prestigefylld global plattform som RRC. Vi är stolta över att teamet på kort tid kan uppnå en hög ranking och stå sida vid sida med stora namn från utvecklade länder. Ännu viktigare är att detta är en tydlig demonstration av förmågan att bemästra teknik för att lösa specifika problem för vietnamesiska och specialiserade områden i Vietnam."
I samband med den starka digitala transformationen och AI-transformationen i Vietnam spelar OCR-teknik (optisk teckenigenkänning) en allt viktigare roll för att digitalisera dokument, automatisera affärsprocesser, spara kostnader och förbättra ledningseffektiviteten.
Men med de vietnamesiska kännetecknen med accenter och handstil stannar inte igenkänningsproblemet vid att "läsa ord", utan kräver att modellen har förmågan att förstå sammanhanget på ett heltäckande sätt.
CATI-VLM skiljer sig från traditionell OCR genom att den inte bara extraherar tecken, utan även förstår flera lager av information: textinnehåll, icke-textelement (kryssrutor, kryssrutor, diagram, signaturer, formler), layout (sidstruktur, tabeller, formulär) och stil (teckensnitt, markeringar...).
Modellen kan svara på visuella frågor som ställs på dokumentbilder, liknande ChatGPT, utan att behöva lära sig specifika formulär i förväg.
Robust Reading Competition (RRC) är en prestigefylld vetenskaplig lekplats, organiserad av Computer Vision Center vid Universitat Autònoma de Barcelona (UAB) Spanien, en prestigefylld forskningsanläggning i världen inom datorseende.
Tävlingen, som inleddes 2011 och alltid äger rum i samband med den internationella konferensen om textanalys och textigenkänning (ICDAR) – ett av världens största forum för dokumentanalys och datorseende – har blivit ett viktigt evenemang som lockar forskare, ingenjörer från prestigefyllda universitet, forskningsinstitut och teknikföretag som Tsinghua University, Hyundai Motor Group och Tencent...
RRC:s uppdrag är utformade för att driva tekniska framsteg, kopplade till verkliga problem som sträcker sig från översättning och hantering av företagsdata till stadsanalys och historisk dokumentbehandling.
Från arbete till föräldraskap: Hur teknikchefer använder AI varje dag. Från Jensen Huang till Tim Cook använder världens mäktigaste teknikchefer AI i sin vardag.
Källa: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html




![[Foto] Da Nang: Vattnet drar sig gradvis tillbaka, lokala myndigheter drar nytta av saneringen](https://vphoto.vietnam.vn/thumb/1200x675/vietnam/resource/IMAGE/2025/10/31/1761897188943_ndo_tr_2-jpg.webp)

![[Foto] Premiärminister Pham Minh Chinh deltar i den femte nationella pressprisutdelningen om att förebygga och bekämpa korruption, slöseri och negativitet.](https://vphoto.vietnam.vn/thumb/1200x675/vietnam/resource/IMAGE/2025/10/31/1761881588160_dsc-8359-jpg.webp)






































































Kommentar (0)