Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC zählt weltweit zu den Top 12 im Bereich der Texterkennung.

Das vom CMC Institute of Applied Technology (CMC ATI) entwickelte CATI-VLM (Visual Document Understanding) Modell hat viele internationale Konkurrenten übertroffen und erreichte in der kürzlich vom Robust Reading Competition (RRC) im Juni 2025 veröffentlichten Rangliste in der Kategorie Document Visual Question Answering (DocVQA) den 12. Platz weltweit und den 1. Platz in Vietnam.

Báo Nhân dânBáo Nhân dân02/07/2025

RRC-Ranking in der DocVQA-Kategorie, Juni 2025.

RRC-Ranking in der DocVQA-Kategorie, Juni 2025.

Im Zuge der rasanten digitalen Transformation und der zunehmenden Verbreitung künstlicher Intelligenz in Vietnam spielt die OCR-Technologie (optische Zeichenerkennung) eine immer wichtigere Rolle bei der Dokumentendigitalisierung, der Automatisierung von Geschäftsprozessen, der Kosteneinsparung und der Steigerung der Managementeffizienz. Aufgrund der besonderen Merkmale der vietnamesischen Sprache, insbesondere ihrer Akzente und Handschrift, geht die Erkennungsaufgabe jedoch über das bloße „Lesen“ von Zeichen hinaus; sie erfordert ein Modell, das den Kontext umfassend erfassen kann.

Kürzlich gab das CMC Institute of Applied Technology (CMC ATI) bekannt, dass das CATI-VLM-Modell (Visual Document Understanding), das von seinem Forschungsteam auf Basis eines großen 5-TB-Data-Warehouses entwickelt wurde, viele internationale Konkurrenten übertroffen hat und in der von Robust Reading Competition (RRC) im Juni 2025 veröffentlichten Rangliste in der Kategorie Document Visual Question Answering (DocVQA) weltweit unter die Top 12 und in Vietnam unter die Top 1 gelangt ist.

Der Robust Reading Competition (RRC) ist ein prestigeträchtiger wissenschaftlicher Wettbewerb (https://rrc.cvc.uab.es/), der vom Computer Vision Centre (CVC) der Autònoma de Barcelona University (UAB), Spanien, einer weltweit renommierten Forschungseinrichtung auf dem Gebiet der Computer Vision, organisiert wird.

Der 2011 ins Leben gerufene Wettbewerb findet jährlich im Rahmen der International Conference on Text Analysis and Recognition (ICDAR) statt – einem der weltweit führenden Foren im Bereich Computer Vision. Er zieht zahlreiche Forscher und Ingenieure von Universitäten, Forschungsinstituten und großen Technologiekonzernen wie der Tsinghua-Universität, der Hyundai Motor Group und Tencent an. Die Aufgaben des RRC sind darauf ausgelegt, den technologischen Fortschritt zu fördern und eng mit praktischen Problemen verknüpft, die von Übersetzung und Datenmanagement in Unternehmen bis hin zu Stadtanalysen und der Verarbeitung historischer Dokumente reichen.

Dr. Dang Minh Tuan, Direktor des CMC ATI, erklärte: „Wir freuen uns sehr, dass die Forschungskompetenz des CMC-Teams durch einen so renommierten globalen Wettbewerb wie den RRC bestätigt wurde. Innerhalb kürzester Zeit hat das Forschungsteam eine hohe Platzierung erreicht und damit seine internationale Wettbewerbsfähigkeit gegenüber führenden Institutionen aus Industrieländern unter Beweis gestellt. Noch wichtiger ist jedoch, dass dies ein klarer Beweis für unsere Fähigkeit ist, Technologien zu beherrschen, um spezifische Probleme im Zusammenhang mit der vietnamesischen Sprache und spezialisierten Fachgebieten in Vietnam zu lösen.“

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Dr. Dang Minh Tuan, Direktor von CMC ATI.

CATI-VLM unterscheidet sich von herkömmlicher OCR dadurch, dass es nicht nur Zeichen extrahiert, sondern auch mehrere Informationsebenen versteht: Textinhalte, Nicht-Text-Elemente (Kontrollkästchen, Diagramme, Unterschriften, Formeln), Layout (Seitenstruktur, Tabellen, Formulare) und Stil (Schriftarten, Hervorhebungen usw.). Das Modell kann, ähnlich wie ChatGPT, visuelle Fragen zu Dokumentenbildern beantworten, ohne jedes einzelne Formular vorher lernen zu müssen.

Bemerkenswert ist, dass CATI-VLM im RRC-Ranking mit nur 3 Milliarden Parametern in 4 von 7 Datensätzen die höchste Genauigkeit erreichte und damit viele Big-Tech-Modelle wie Deepseek (27 Milliarden Parameter), GPT-4 Vision Turbo + Amazon Textract OCR (Top 34) und Baidu (Top 22) übertraf.

Die Leistung beweist auch einen praxisorientierten Ansatz, der sich auf die Beherrschung von Kerntechnologien und die Optimierung von Modellen konzentriert, um den Infrastrukturbedingungen Vietnams gerecht zu werden, anstatt Skalierbarkeitsparametern hinterherzujagen.

image-2.jpg

Beispiel eines Hochschulzulassungsantragsformulars

image-3.jpg

Der Text wurde anhand der Handschrift im obigen Bild identifiziert.

Herr Nguyen Trung Chinh, Vorstandsvorsitzender und Executive Chairman der CMC Technology Group, betonte: „Dies ist das Ergebnis von über einem Jahrzehnt kontinuierlicher Investitionen in Forschung und Entwicklung (F&E). Die herausragenden Erfolge von CMC im internationalen Technologiesektor bestätigen unsere Strategie, vietnamesische Technologie zu beherrschen, verbunden mit unserer Ausrichtung auf die Transformation im Bereich der Künstlichen Intelligenz und der Expansion auf den globalen Markt. Wir sind überzeugt, dass vietnamesische Technologie durchaus in der Lage ist, mit den globalen Technologiekonzernen zu konkurrieren und sich einen bedeutenden Platz auf der Weltkarte der Technologie zu sichern.“

CATI-VLM wird im C.OpenAI-Produktökosystem eingesetzt, darunter: der virtuelle Assistent CLS zur Überprüfung juristischer Dokumente, CMC SmartDoc – eine Plattform zur digitalen Dokumententransformation, das Wissensmanagementsystem CMC KMS, ein automatisiertes Berichtssystem für intelligente Büros und Agentic Documents-Anwendungen der nächsten Generation.

QUANG HUY

Quelle: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Etikett: CMCCMC Corp

Kommentar (0)

Hinterlasse einen Kommentar, um deine Gefühle zu teilen!

Gleiches Thema

Gleiche Kategorie

Gleicher Autor

Erbe

Figur

Unternehmen

Aktuelles

Politisches System

Lokal

Produkt

Happy Vietnam
Lam Vien Platz - Das Herz von Da Lat

Lam Vien Platz - Das Herz von Da Lat

Glücklich

Glücklich

Heilig

Heilig