Vietnam.vn - Nền tảng quảng bá Việt Nam

CMCs «Make in Vietnam»-kjerne-AI rangert blant de 12 beste i verden

CATI-VLM-modellen utviklet av CMCs forskerteam har kommet inn blant de 12 beste i verden og topp 1 i Vietnam på rangeringen som nylig ble annonsert av Robust Reading Competition i juni 2025.

VietNamNetVietNamNet02/07/2025


AI-modell.jpg

AI-transformasjonen i Vietnam skjer sterkt, og OCR-teknologi (optisk tegngjenkjenning) spiller en stadig viktigere rolle i digitalisering av dokumenter. Foto: Illustrasjon

Nylig annonserte CMC Technology Application Institute (CMC ATI) CATI-VLM-modellen (Visual Document Understanding) utviklet av forskerteamet fra et stort datalager på 5 TB, og nådde topp 12 i verden og topp 1 i Vietnam på rangeringene som nettopp ble annonsert av Robust Reading Competition (RRC) i juni 2025 i kategorien Document Visual Question Answering (DocVQA).

Dang Minh Tuan, direktør for CMC ATI, uttalte: «Vi er svært glade for at CMC-teamets forskningskapasitet har blitt bekreftet gjennom en prestisjefylt global lekeplass som RRC. Vi er stolte av at teamet på kort tid kan oppnå en høy rangering, og stå skulder ved skulder med store navn fra utviklede land. Enda viktigere er dette en tydelig demonstrasjon av evnen til å mestre teknologi for å løse spesifikke problemer i vietnamesisk og spesialiserte felt i Vietnam.»

I sammenheng med digital transformasjon og AI-transformasjon som foregår sterkt i Vietnam, spiller OCR-teknologi (optisk tegngjenkjenning) en stadig viktigere rolle i digitalisering av dokumenter, automatisering av forretningsprosesser, kostnadsbesparelser og forbedring av ledelseseffektiviteten.

Men med de vietnamesiske kjennetegnene med aksenter og håndskrift, stopper ikke gjenkjenningsproblemet ved å «lese ord», men krever at modellen har evnen til å forstå konteksten fullstendig.

CATI-VLM skiller seg fra tradisjonell OCR ved at den ikke bare trekker ut tegn, men også forstår flere lag med informasjon: tekstinnhold, ikke-tekstelementer (avkrysningsbokser, avmerkingsbokser, diagrammer, signaturer, formler), layout (sidestruktur, tabeller, skjemaer) og stil (fonter, uthevinger…).

Modellen kan svare på visuelle spørsmål stilt på dokumentbilder, på samme måte som ChatGPT, uten å måtte lære spesifikke skjemaer på forhånd.

CMC AI.jpg

Robust Reading Competition (RRC) er en prestisjefylt vitenskapelig lekeplass, organisert av Computer Vision Center ved Universitat Autònoma de Barcelona (UAB) Spania, et prestisjefylt forskningssenter i verden innen datasyn.

Konkurransen ble startet i 2011 og følger alltid den internasjonale konferansen om tekstanalyse og -gjenkjenning (ICDAR) – et av verdens største forum for dokumentanalyse og datasyn –. Konkurransen har blitt en viktig begivenhet som tiltrekker seg forskere, ingeniører fra prestisjetunge universiteter, forskningsinstitutter og teknologiselskaper som Tsinghua University, Hyundai Motor Group og Tencent...

RRCs oppdrag er utformet for å drive teknologisk fremgang, knyttet til virkelige problemer som spenner fra oversettelse og håndtering av bedriftsdata til urban analyse og behandling av historiske dokumenter.

Fra jobb til foreldrerollen: Hvordan teknologidirektører bruker AI hver dag. Fra Jensen Huang til Tim Cook utnytter verdens mektigste teknologidirektører AI i hverdagen.

Kilde: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html


Kommentar (0)

No data
No data

I samme emne

I samme kategori

Gjenoppføring av Ly-dynastiets midthøstfestival ved Thang Long keiserlige citadell
Vestlige turister liker å kjøpe leker til midthøstfestivalen på Hang Ma-gaten for å gi til barna og barnebarna sine.
Hang Ma-gaten er strålende med midthøstfarger, unge mennesker sjekker begeistret inn non-stop
Historisk budskap: Treblokker av Vinh Nghiem-pagoden – en dokumentarisk kulturarv for menneskeheten

Av samme forfatter

Arv

;

Figur

;

Forretninger

;

No videos available

Aktuelle hendelser

;

Det politiske systemet

;

Lokalt

;

Produkt

;