Vietnam.vn - Nền tảng quảng bá Việt Nam

«Make in Vietnam»-kjerne-AI rangert blant de 12 beste i verden

Ifølge evalueringen av Robust Reading Competition (RRC – en prestisjefylt vitenskapelig lekeplass i verden), er CATI-VLM-modellen for bildetekstgjenkjenning, et «Make in Vietnam»-produkt, rangert blant de 12 beste i verden.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp03/07/2025



I forbindelse med digital transformasjon og kunstig intelligens (KI) i Vietnam spiller OCR-teknologi (optisk tegngjenkjenning) en stadig viktigere rolle i digitalisering av dokumenter, automatisering av forretningsprosesser, kostnadsbesparelser og forbedring av ledelseseffektiviteten. Med vietnamesisk språks særtrekk med aksenter og håndskrift stopper imidlertid ikke gjenkjenningsproblemet ved å «lese ord», men krever at modellen har evnen til å forstå konteksten fullstendig.

Nylig annonserte CMC Technology Application Institute (CMC ATI) CATI-VLM-modellen (Visual Document Understanding) utviklet av forskerteamet fra et stort datalager på 5 TB, og nådde topp 12 i verden og topp 1 i Vietnam på rangeringene som nettopp ble annonsert av Robust Reading Competition (RRC) i juni 2025 i kategorien Document Visual Question Answering (DocVQA).

Bildetekst

RRC-rangering i DocVQA-kategori 6/2025.

Robust Reading Competition (RRC) er en prestisjefylt vitenskapelig lekeplass (https://rrc.cvc.uab.es/) organisert av Computer Vision Center (CVC) ved Universitat Autònoma de Barcelona (UAB) i Spania, et prestisjefylt forskningssenter i verden innen datasyn. Konkurransen ble startet i 2011 og følger alltid den internasjonale konferansen om tekstanalyse og -gjenkjenning (ICDAR) – et av verdens største forum for dokumentanalyse og datasyn –. Konkurransen har blitt et viktig arrangement som tiltrekker seg forskere, ingeniører fra prestisjefylte universiteter, forskningsinstitutter og teknologiselskaper som Tsinghua University, Hyundai Motor Group og Tencent... RRCs oppgaver er utformet for å fremme teknologisk fremgang, nært knyttet til praktiske problemer fra oversettelse og bedriftsdatahåndtering til byanalyse og historisk dokumentbehandling.

Dr. Dang Minh Tuan, direktør for CMC ATI, delte: «CMC-teamets forskningskapasitet bekreftes gjennom en prestisjefylt global lekeplass som RRC. Vi er stolte av at teamet på kort tid kan oppnå en høy rangering, og stå skulder ved skulder med store navn fra utviklede land. Enda viktigere er dette en tydelig demonstrasjon av evnen til å mestre teknologi for å løse spesifikke problemer i vietnamesisk og spesialiserte felt i Vietnam.»


CATI-VLM skiller seg fra tradisjonell OCR ved at den ikke bare trekker ut tegn, men også forstår flere lag med informasjon: tekstinnhold, ikke-tekstelementer (avkrysningsbokser, avmerkingsbokser, diagrammer, signaturer, formler), layout (sidestruktur, tabeller, skjemaer) og stil (fonter, uthevinger osv.). Modellen kan svare på visuelle spørsmål stilt på dokumentbilder, i likhet med ChatGPT, uten å måtte lære spesifikke skjemaer på forhånd.



Ifølge avisen News and People

Kilde: https://doanhnghiepvn.vn/cong-nghe/ai-loi-make-in-vietnam-duoc-xep-hang-top-12-the-gioi/20250703100726051


Kommentar (0)

No data
No data

I samme emne

I samme kategori

Ho Chi Minh-byen tiltrekker seg investeringer fra utenlandske direkteinvesteringer i nye muligheter
Historiske flommer i Hoi An, sett fra et militærfly fra Forsvarsdepartementet
Den «store flommen» av Thu Bon-elven oversteg den historiske flommen i 1964 med 0,14 m.
Dong Van steinplatå – et sjeldent «levende geologisk museum» i verden

Av samme forfatter

Arv

Figur

Forretninger

Beundre «Ha Long Bay on land» som nettopp er en av verdens mest populære reisemål

Aktuelle hendelser

Det politiske systemet

Lokalt

Produkt