Vietnam.vn - Nền tảng quảng bá Việt Nam

Базовий штучний інтелект CMC «Зроблено у В'єтнамі» потрапив до 12 найкращих у світі

Модель CATI-VLM, розроблена дослідницькою групою CMC, увійшла до 12 найкращих у світі та до 1-го місця у В'єтнамі в рейтингу, нещодавно оголошеному конкурсом Robust Reading Competition у червні 2025 року.

VietNamNetVietNamNet02/07/2025


Модель ШІ.jpg

Трансформація штучного інтелекту у В'єтнамі відбувається активними темпами, технологія OCR (оптичного розпізнавання символів) відіграє дедалі важливішу роль в оцифруванні документів. Фото: Ілюстрація

Нещодавно Інститут застосування технологій CMC (CMC ATI) оголосив про модель CATI-VLM (візуальне розуміння документів), розроблену дослідницькою групою на основі великого сховища даних об'ємом 5 ТБ, яка потрапила до 12 найкращих у світі та 1-го місця у В'єтнамі в рейтингу, щойно оголошеному конкурсом Robust Reading Competition (RRC) у червні 2025 року в категорії «Візуальні відповіді на запитання щодо документів» (DocVQA).

Пан Данг Мінь Туан, директор CMC ATI, поділився: «Ми дуже раді, що дослідницький потенціал команди CMC був підтверджений завдяки престижному світовому майданчику, такому як RRC. Ми пишаємося тим, що за короткий час команда змогла досягти високого рейтингу, стоячи пліч-о-пліч з відомими іменами з розвинених країн. Що ще важливіше, це чітка демонстрація здатності опанувати технології для вирішення конкретних проблем В'єтнаму та спеціалізованих галузей у В'єтнамі».

У контексті активного розвитку цифрової трансформації та трансформації штучного інтелекту у В'єтнамі, технологія OCR (оптичного розпізнавання символів) відіграє дедалі важливішу роль в оцифруванні документів, автоматизації бізнес-процесів, економії витрат та підвищенні ефективності управління.

Однак, враховуючи особливості в'єтнамської мови з акцентами та почерком, проблема розпізнавання не обмежується «читанням слів», а вимагає від моделі здатності всебічно розуміти контекст.

CATI-VLM відрізняється від традиційного OCR тим, що він не лише витягує символи, але й розуміє кілька шарів інформації: текстовий вміст, нетекстові елементи (галатки, прапорці, діаграми, підписи, формули), макет (структуру сторінки, таблиці, форми) та стиль (шрифти, виділення…).

Модель може відповідати на візуальні запитання, поставлені на зображеннях документів, подібно до ChatGPT, без необхідності попередньо вивчати конкретні форми.

CMC ШІ.jpg

Змагання з надійного читання (RRC) – це престижний науковий майданчик, організований Центром комп’ютерного зору Автономного університету Барселони (UAB) Іспанія, престижним дослідницьким центром у світі в галузі комп’ютерного зору.

Започаткований у 2011 році, цей конкурс завжди супроводжує Міжнародну конференцію з аналізу та розпізнавання тексту ICDAR – один з найбільших у світі форумів з аналізу документів та комп’ютерного зору, став важливою подією, що залучає дослідників, інженерів з престижних університетів, дослідницьких інститутів та технологічних компаній, таких як Університет Цінхуа, Hyundai Motor Group та Tencent...

Місії RRC покликані стимулювати технологічний прогрес і пов'язані з реальними проблемами, починаючи від перекладу та управління корпоративними даними і закінчуючи міською аналітикою та обробкою історичних документів.

Від роботи до виховання дітей: як генеральні директори технологічних компаній використовують ШІ щодня. Від Дженсена Хуанга до Тіма Кука, найвпливовіші генеральні директори технологічних компаній світу використовують ШІ у своєму повсякденному житті.

Джерело: https://vietnamnet.vn/ai-loi-make-in-vietnam-cua-cmc-duoc-xep-hang-top-12-the-gioi-2417479.html


Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Відкриття виставки художньої фотографії «Барви життя в'єтнамських етнічних груп»
Хошимін: вулиця ліхтарів Луонг Нху Хок барвиста, щоб зустріти Свято середини осені
Збереження духу Свята середини осені через кольори фігурок
Відкрийте для себе єдине село у В'єтнамі, яке входить до списку 50 найкрасивіших сіл світу

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Новини

Політична система

Місцевий

Продукт