Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC входит в число 12 лучших в мире систем распознавания текста.

Модель CATI-VLM (Visual Document Understanding), разработанная Институтом прикладных технологий CMC (CMC ATI), превзошла многих международных конкурентов, войдя в топ-12 в мире и заняв первое место во Вьетнаме в рейтинге, объявленном недавно в июне 2025 года в рамках конкурса Robust Reading Competition (RRC) в категории «Визуальные вопросы и ответы по документам» (DocVQA).

Báo Nhân dânBáo Nhân dân02/07/2025

Рейтинг RRC в категории DocVQA, июнь 2025 г.

Рейтинг RRC в категории DocVQA, июнь 2025 г.

В условиях стремительной цифровой трансформации и внедрения искусственного интеллекта во Вьетнаме технология оптического распознавания символов (OCR) играет все более важную роль в оцифровке документов, автоматизации бизнес-процессов, экономии затрат и повышении эффективности управления. Однако, учитывая уникальные особенности вьетнамского языка, включая акцент и почерк, проблема распознавания выходит за рамки простого «чтения» символов; она требует модели, способной всесторонне понимать контекст.

Недавно Институт прикладных технологий CMC (CMC ATI) объявил о том, что разработанная его исследовательской группой модель CATI-VLM (Visual Document Understanding) на основе обширного хранилища данных объемом 5 ТБ превзошла многих международных конкурентов, войдя в топ-12 в мире и заняв первое место во Вьетнаме в рейтинге, опубликованном Robust Reading Competition (RRC) в июне 2025 года в категории «Визуальные вопросы и ответы по документам» (DocVQA).

Конкурс Robust Reading Competition (RRC) — это престижный научный конкурс (https://rrc.cvc.uab.es/), организованный Центром компьютерного зрения (CVC) Автономного университета Барселоны (UAB), Испания, всемирно известным исследовательским учреждением в области компьютерного зрения.

Конкурс, начатый в 2011 году, проводится ежегодно в рамках Международной конференции по анализу и распознаванию текста (ICDAR) – одного из ведущих мировых форумов в области компьютерного зрения. Конкурс привлекает многочисленных исследователей и инженеров из университетов, научно-исследовательских институтов и крупных технологических корпораций, таких как Университет Цинхуа, Hyundai Motor Group и Tencent. Задачи RRC призваны способствовать технологическому прогрессу и тесно связаны с практическими проблемами, начиная от перевода и управления корпоративными данными и заканчивая анализом городской среды и обработкой исторических документов.

Д-р Данг Минь Туан, директор CMC ATI, отметил: «Мы рады, что исследовательский потенциал команды CMC был подтвержден престижным международным конкурсом RRC. За короткое время исследовательская группа достигла высокого рейтинга, продемонстрировав международную конкурентоспособность на уровне ведущих компаний развитых стран. Что еще важнее, это является наглядным доказательством нашей способности осваивать технологии для решения конкретных проблем, связанных с вьетнамским языком и специализированными областями вьетнамского языка».

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

Доктор Данг Минь Туан, директор CMC ATI.

CATI-VLM отличается от традиционного OCR тем, что он не только извлекает символы, но и понимает несколько уровней информации: текстовое содержимое, нетекстовые элементы (флажки, таблицы, подписи, формулы), макет (структура страницы, таблицы, формы) и стиль (шрифты, выделение и т. д.). Модель может отвечать на визуальные вопросы, заданные на изображениях документов, подобно ChatGPT, без необходимости предварительного изучения каждой конкретной формы.

Примечательно, что в рейтинге RRC модель CATI-VLM, имеющая всего 3 миллиарда параметров, достигла наивысшей точности в 4 из 7 наборов данных, превзойдя многие модели крупных технологических компаний, такие как Deepseek (27 миллиардов параметров), GPT-4 Vision Turbo + Amazon Textract OCR (топ-34) и Baidu (топ-22).

Это достижение также демонстрирует практический подход, ориентированный на освоение основных технологий и оптимизацию моделей в соответствии с инфраструктурными условиями Вьетнама, а не на погоню за масштабируемостью и параметрами.

image-2.jpg

Пример формы заявления о приеме в университет

image-3.jpg

Текст был идентифицирован по почерку на изображении выше.

Г-н Нгуен Чунг Чинь, председатель совета директоров и исполнительный председатель CMC Technology Group, подчеркнул: «Это результат более чем десятилетних постоянных инвестиций в исследования и разработки (НИОКР) в области технологий. Высокие достижения CMC на международной технологической арене подтверждают нашу стратегию освоения вьетнамских технологий в сочетании с нашей ориентацией на трансформацию в сфере искусственного интеллекта и расширение на мировой рынок. Мы верим, что вьетнамский интеллектуальный сектор полностью способен конкурировать с глобальными технологическими гигантами, заняв достойное место на мировой технологической карте».

CATI-VLM будет применяться в экосистеме продуктов C.OpenAI, включая: виртуального помощника CLS для проверки юридических документов, CMC SmartDoc — платформу для цифровой трансформации документов, систему управления знаниями CMC KMS, автоматизированную систему отчетности для «умных» офисов и приложения Agentic Documents нового поколения.

КУАНГ ХУЙ

Источник: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


Тема: CMCCMC Corp

Комментарий (0)

Оставьте комментарий, чтобы поделиться своими чувствами!

Та же тема

Та же категория

Тот же автор

Наследство

Фигура

Предприятия

Актуальные события

Политическая система

Местный

Продукт

Happy Vietnam
Райская пещера

Райская пещера

Величественная река Нхо Куэ – прекрасное зрелище среди бескрайних лесов Вьетнама.

Величественная река Нхо Куэ – прекрасное зрелище среди бескрайних лесов Вьетнама.

Рисовое молоко

Рисовое молоко