En el contexto de la transformación digital y la transformación de las aplicaciones de inteligencia artificial que se está produciendo fuertemente en Vietnam, la tecnología OCR (reconocimiento óptico de caracteres) juega un papel cada vez más importante en la digitalización de documentos, la automatización de procesos comerciales, el ahorro de costos y la mejora de la eficiencia de la gestión.
Sin embargo, con las características del vietnamita con acentos y escritura a mano, el problema de reconocimiento no se detiene en "leer palabras", sino que requiere que el modelo tenga la capacidad de comprender el contexto de manera integral.
Ante este reto, el CMC Technology Application Institute (CMC ATI) ha desarrollado el modelo CATI-VLM, un sistema de comprensión de documentos mediante visión artificial (Visual Document Understanding).
Basado en un gran almacén de datos de hasta 5 TB, este modelo acaba de ser clasificado entre los 12 mejores del mundo y el primero en Vietnam en la Competición internacional de lectura robusta (RRC), categoría de respuesta visual a preguntas de documentos (DocVQA), celebrada en junio de 2025.
(Agencia de Noticias de Vietnam/Vietnam+)
Fuente: https://www.vietnamplus.vn/tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post1048696.vnp
Kommentar (0)