AI-transformasjonen i Vietnam skjer sterkt, og OCR-teknologi (optisk tegngjenkjenning) spiller en stadig viktigere rolle i digitalisering av dokumenter. Foto: Illustrasjon
Nylig annonserte CMC Technology Application Institute (CMC ATI) CATI-VLM-modellen (Visual Document Understanding) utviklet av forskerteamet fra et stort datalager på 5 TB, og nådde topp 12 i verden og topp 1 i Vietnam på rangeringene som nettopp ble annonsert av Robust Reading Competition (RRC) i juni 2025 i kategorien Document Visual Question Answering (DocVQA).
Dang Minh Tuan, direktør for CMC ATI, uttalte: «Vi er svært glade for at CMC-teamets forskningskapasitet har blitt bekreftet gjennom en prestisjefylt global lekeplass som RRC. Vi er stolte av at teamet på kort tid kan oppnå en høy rangering, og stå skulder ved skulder med store navn fra utviklede land. Enda viktigere er dette en tydelig demonstrasjon av evnen til å mestre teknologi for å løse spesifikke problemer i vietnamesisk og spesialiserte felt i Vietnam.»
I sammenheng med digital transformasjon og AI-transformasjon som foregår sterkt i Vietnam, spiller OCR-teknologi (optisk tegngjenkjenning) en stadig viktigere rolle i digitalisering av dokumenter, automatisering av forretningsprosesser, kostnadsbesparelser og forbedring av ledelseseffektiviteten.
Men med de vietnamesiske kjennetegnene med aksenter og håndskrift, stopper ikke gjenkjenningsproblemet ved å «lese ord», men krever at modellen har evnen til å forstå konteksten fullstendig.
CATI-VLM skiller seg fra tradisjonell OCR ved at den ikke bare trekker ut tegn, men også forstår flere lag med informasjon: tekstinnhold, ikke-tekstelementer (avkrysningsbokser, avmerkingsbokser, diagrammer, signaturer, formler), layout (sidestruktur, tabeller, skjemaer) og stil (fonter, uthevinger…).
Modellen kan svare på visuelle spørsmål stilt på dokumentbilder, på samme måte som ChatGPT, uten å måtte lære spesifikke skjemaer på forhånd.
Robust Reading Competition (RRC) er en prestisjefylt vitenskapelig lekeplass, organisert av Computer Vision Center ved Universitat Autònoma de Barcelona (UAB) Spania, et prestisjefylt forskningssenter i verden innen datasyn.
Konkurransen ble startet i 2011 og følger alltid den internasjonale konferansen om tekstanalyse og -gjenkjenning (ICDAR) – et av verdens største forum for dokumentanalyse og datasyn –. Konkurransen har blitt en viktig begivenhet som tiltrekker seg forskere, ingeniører fra prestisjetunge universiteter, forskningsinstitutter og teknologiselskaper som Tsinghua University, Hyundai Motor Group og Tencent...
RRCs oppdrag er utformet for å drive teknologisk fremgang, knyttet til virkelige problemer som spenner fra oversettelse og håndtering av bedriftsdata til urban analyse og behandling av historiske dokumenter.
Fra jobb til foreldrerollen: Hvordan teknologidirektører bruker AI hver dag. Fra Jensen Huang til Tim Cook utnytter verdens mektigste teknologidirektører AI i hverdagen.
Kilde: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html
Kommentar (0)