
В контексте цифровой трансформации и трансформации приложений искусственного интеллекта, происходящих во Вьетнаме, технология OCR (оптическое распознавание символов) играет все более важную роль в оцифровке документов, автоматизации бизнес-процессов, экономии затрат и повышении эффективности управления.
Однако, учитывая особенности вьетнамского языка с его акцентом и почерком, проблема распознавания не ограничивается «чтением слов», а требует от модели способности всесторонне понимать контекст.
Столкнувшись с этой проблемой, Институт применения технологий CMC ( CMC ATI) разработал модель CATI-VLM — систему понимания документов с использованием компьютерного зрения (визуальное понимание документов).
Эта модель, основанная на большом хранилище данных объемом до 5 ТБ, недавно вошла в число 12 лучших в мире и в число 1 лучших во Вьетнаме на международном конкурсе Robust Reading Competition (RRC) в категории Document Visual Question Answering (DocVQA), который состоялся в июне 2025 года.
Источник: https://nhandan.vn/infographic-tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post892567.html
Комментарий (0)