Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC erreicht weltweit die Top 12 in der Texterkennung

Das vom CMC Technology Application Institute (CMC ATI) entwickelte CATI-VLM-Modell (Visual Document Understanding) hat viele internationale Konkurrenten übertroffen und in der kürzlich von der Robust Reading Competition (RRC) im Juni 2025 in der Kategorie Document Visual Question Answering (DocVQA) veröffentlichten Rangliste die Top 12 der Welt und die Top 1 in Vietnam erreicht.

Báo Nhân dânBáo Nhân dân02/07/2025

RRC-Ranking in DocVQA-Kategorie 6/2025.
RRC-Ranking in DocVQA-Kategorie 6/2025.

Im Kontext der digitalen Transformation und der Transformation künstlicher Intelligenz in Vietnam spielt die OCR-Technologie (Optical Character Recognition) eine zunehmend wichtige Rolle bei der Digitalisierung von Dokumenten, der Automatisierung von Geschäftsprozessen, der Kosteneinsparung und der Verbesserung der Managementeffizienz. Angesichts der Besonderheiten der vietnamesischen Sprache mit Akzenten und Handschrift beschränkt sich das Erkennungsproblem jedoch nicht auf das Lesen von Wörtern, sondern erfordert ein umfassendes Kontextverständnis des Modells.

Kürzlich hat das CMC Technology Application Institute (CMC ATI) das CATI-VLM-Modell (Visual Document Understanding) angekündigt – das von einem Forschungsteam auf der Grundlage eines 5 TB großen Data Warehouse entwickelt wurde. Damit ließ es viele internationale Konkurrenten hinter sich und erreichte in der gerade von der Robust Reading Competition (RRC) im Juni 2025 bekannt gegebenen Rangliste in der Kategorie Document Visual Question Answering (DocVQA) die Top 12 der Welt und die Top 1 in Vietnam.

Robust Reading Competition (RRC) ist ein renommierter wissenschaftlicher Spielplatz (https://rrc.cvc.uab.es/), der vom Computer Vision Center (CVC) der Autonomen Universität Barcelona (UAB) in Spanien organisiert wird, einer weltweit renommierten Forschungseinrichtung auf dem Gebiet der Computervision.

Der Wettbewerb wurde 2011 ins Leben gerufen und findet jährlich im Rahmen der International Conference on Text Analysis and Recognition (ICDAR) statt – einem der weltweit führenden Foren im Bereich Computer Vision. Der Wettbewerb zieht zahlreiche Forscher und Ingenieure von Universitäten, Forschungsinstituten und großen Technologiekonzernen wie der Tsinghua-Universität, der Hyundai Motor Group, Tencent usw. an. Die Aufgabenstellungen der RRC zielen darauf ab, den technologischen Fortschritt zu fördern und sind eng mit praktischen Problemen verknüpft, von Übersetzung und Unternehmensdatenmanagement bis hin zu Stadtanalyse und historischer Dokumentenverarbeitung.

Dr. Dang Minh Tuan, Direktor von CMC ATI, erklärte: „Wir freuen uns sehr, dass die Forschungskapazität des CMC-Teams durch eine renommierte globale Plattform wie RRC bestätigt wurde. Innerhalb kurzer Zeit hat das Forschungsteam hohe Platzierungen erreicht und damit seine internationale Wettbewerbsfähigkeit mit namhaften Unternehmen aus Industrieländern unter Beweis gestellt. Noch wichtiger ist, dass dies ein klarer Beweis für die Fähigkeit ist, Technologien zu beherrschen, um spezifische Probleme der Vietnamesen und spezialisierter Bereiche in Vietnam zu lösen.“

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg
Dr. Dang Minh Tuan, Direktor von CMC ATI.

CATI-VLM unterscheidet sich von herkömmlicher OCR dadurch, dass es nicht nur Zeichen extrahiert, sondern auch mehrere Informationsebenen versteht: Textinhalte, Nicht-Text-Elemente (Kontrollkästchen, Diagramme, Signaturen, Formeln), Layout (Seitenstruktur, Tabellen, Formulare) und Stil (Schriftarten, Hervorhebungen usw.). Ähnlich wie ChatGPT kann das Modell visuelle Fragen zu Dokumentbildern beantworten, ohne dass spezifische Formulare im Voraus erlernt werden müssen.

Bemerkenswert ist, dass CATI-VLM in der RRC-Rangliste mit nur 3 Milliarden Parametern die höchste Genauigkeit in 4/7 Datensätzen erreichte und viele Big-Tech-Modelle wie Deepseek (27 Milliarden Parameter), GPT-4 Vision Turbo + Amazon Textract OCR (Top 34) oder Baidu (Top 22) übertraf.

Dieser Erfolg zeugt auch von einem praktischen Ansatz, der sich auf die Beherrschung der Kerntechnologie konzentriert und das Modell an die Infrastrukturbedingungen Vietnams anpasst, anstatt der Parameterskala hinterherzujagen.

hinh-2.jpg
Beispiel eines Bewerbungsformulars für die College-Zulassung
hinh-3.jpg
Im obigen Bild wurde der Text anhand der Handschrift erkannt.

Herr Nguyen Trung Chinh, Vorstandsvorsitzender und Executive Chairman der CMC Technology Group, betonte: „Dies ist das Ergebnis von über einem Jahrzehnt kontinuierlicher Investitionen in Technologieforschung und -entwicklung (F&E). Die herausragenden Erfolge von CMC auf dem internationalen Technologiemarkt bestätigen die Strategie, vietnamesische Technologie zu beherrschen, gepaart mit der Ausrichtung auf die KI-Transformation und den Eintritt in den globalen Markt. Wir sind überzeugt, dass der vietnamesische Geheimdienst durchaus in der Lage ist, Seite an Seite mit den globalen Big Tech-Unternehmen zu bestehen und sich einen würdigen Platz auf der weltweiten Technologielandkarte zu sichern.“

CATI-VLM wird in der Produktkette des C.OpenAI-Ökosystems eingesetzt, darunter: virtueller CLS-Assistent zur Überprüfung juristischer Dokumente, CMC SmartDoc – Plattform zur digitalen Dokumentenkonvertierung, CMC KMS-Wissensmanagementsystem, automatisches Berichtssystem für intelligente Büros und Agentic Documents-Anwendungen der neuen Generation.

Quelle: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Kommentar (0)

No data
No data
Bild von Terrassenfeldern in Phu Tho, sanft abfallend, hell und schön wie Spiegel vor der Pflanzsaison
Z121 Factory ist bereit für die International Fireworks Final Night
Berühmtes Reisemagazin lobt Son-Doong-Höhle als „die großartigste der Welt“
Geheimnisvolle Höhle zieht westliche Touristen an, vergleichbar mit der „Phong Nha-Höhle“ in Thanh Hoa
Entdecken Sie die poetische Schönheit der Vinh Hy Bay
Wie wird der teuerste Tee in Hanoi, der über 10 Millionen VND/kg kostet, verarbeitet?
Geschmack der Flussregion
Wunderschöner Sonnenaufgang über dem Meer von Vietnam
Der majestätische Höhlenbogen in Tu Lan
Lotustee – Ein duftendes Geschenk der Hanoi

Erbe

Figur

Geschäft

No videos available

Nachricht

Politisches System

Lokal

Produkt