Dans le contexte de la transformation numérique et de la transformation des applications d'intelligence artificielle au Vietnam, la technologie OCR (reconnaissance optique de caractères) joue un rôle de plus en plus important dans la numérisation des documents, l'automatisation des processus commerciaux, la réduction des coûts et l'amélioration de l'efficacité de la gestion.
Cependant, avec les caractéristiques du vietnamien avec les accents et l'écriture manuscrite, le problème de reconnaissance ne s'arrête pas à la « lecture des mots », mais nécessite que le modèle ait la capacité de comprendre le contexte de manière exhaustive.
Face à ce défi, le CMC Technology Application Institute (CMC ATI) a développé le modèle CATI-VLM - un système de compréhension de documents utilisant la vision par ordinateur (Visual Document Understanding).
Basé sur un important entrepôt de données pouvant atteindre 5 To, ce modèle vient d'être classé Top 12 mondial et Top 1 au Vietnam au concours international Robust Reading Competition (RRC), catégorie Document Visual Question Answering (DocVQA), organisé en juin 2025./.
(Agence de presse vietnamienne/Vietnam+)
Source : https://www.vietnamplus.vn/tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post1048696.vnp
Comment (0)