Vietnam.vn - Nền tảng quảng bá Việt Nam

CMC는 텍스트 인식 분야에서 전 세계 상위 12위 안에 랭크되어 있습니다.

CMC 응용기술연구소(CMC ATI)에서 개발한 CATI-VLM(Visual Document Understanding) 모델이 최근 2025년 6월에 발표된 Robust Reading Competition(RRC)의 문서 시각적 질문 답변(DocVQA) 부문 순위에서 세계 12위, 베트남 1위를 차지하며 여러 국제 경쟁 모델을 제치고 정상에 올랐습니다.

Báo Nhân dânBáo Nhân dân02/07/2025

2025년 6월 기준, DocVQA 부문에서 RRC의 순위.

2025년 6월 기준, DocVQA 부문에서 RRC의 순위.

베트남의 급속한 디지털 전환과 인공지능 도입 속에서 OCR(광학 문자 인식) 기술은 문서 디지털화, 비즈니스 프로세스 자동화, 비용 절감 및 경영 효율성 향상에 점점 더 중요한 역할을 하고 있습니다. 그러나 베트남어는 억양과 필기체 등 고유한 특성을 지니고 있어, 단순히 문자를 '읽는' 것을 넘어 문맥을 종합적으로 이해할 수 있는 모델이 필요합니다.

최근 CMC 응용기술연구소(CMC ATI)는 자체 연구팀이 5TB 규모의 대형 데이터 웨어하우스를 기반으로 개발한 CATI-VLM(Visual Document Understanding) 모델이 2025년 6월 Robust Reading Competition(RRC)에서 발표한 문서 시각적 질문 답변(DocVQA) 부문 순위에서 세계 12위, 베트남 1위를 차지하며 여러 국제 경쟁사를 제치고 정상에 올랐다고 발표했습니다.

로버스트 리딩 경진대회(RRC)는 세계적으로 유명한 컴퓨터 비전 연구 기관인 스페인 바르셀로나 자치대학교(UAB) 컴퓨터 비전 센터(CVC)에서 주최하는 권위 있는 과학 경진대회입니다(https://rrc.cvc.uab.es/).

2011년에 시작된 이 대회는 세계적인 컴퓨터 비전 학술대회인 국제 텍스트 분석 및 인식 학회(ICDAR)의 일환으로 매년 개최됩니다. 칭화대학교, 현대자동차그룹, 텐센트 등 주요 기술 기업을 비롯한 대학, 연구기관의 수많은 연구원과 엔지니어들이 이 대회에 참여합니다. RRC 문제들은 번역, 기업 데이터 관리, 도시 분석, 역사 문서 처리 등 다양한 실용적인 문제와 밀접하게 연관되어 기술 발전을 촉진하도록 설계되었습니다.

CMC ATI 소장인 당 민 뚜안 박사는 "CMC 연구팀의 연구 역량이 RRC와 같은 권위 있는 국제 대회에서 인정받게 되어 매우 기쁩니다. 단기간에 높은 순위를 달성하며 선진국의 주요 연구팀들과 어깨를 나란히 할 수 있는 국제적 경쟁력을 보여주었습니다. 더욱 중요한 것은, 이는 베트남어 및 베트남의 특정 분야와 관련된 문제들을 해결하기 위한 기술력을 갖추고 있음을 분명히 입증하는 것입니다."라고 소감을 밝혔습니다.

z6764757325423-eeef2a0ed90465644555dcab3096c25c.jpg

CMC ATI 이사 Dang Minh Tuan 박사.

CATI-VLM은 기존 OCR과 달리 문자만 추출하는 것이 아니라 텍스트 내용, 비텍스트 요소(체크박스, 차트, 서명, 수식), 레이아웃(페이지 구조, 표, 양식), 스타일(글꼴, 강조 표시 등)과 같은 여러 계층의 정보를 이해합니다. 이 모델은 ChatGPT와 유사하게 문서 이미지에 제시된 시각적 질문에 답변할 수 있으며, 각 특정 양식을 사전에 학습할 필요가 없습니다.

특히 RRC 순위에서 CATI-VLM은 단 30억 개의 파라미터만으로 7개 데이터셋 중 4개에서 최고 정확도를 달성하여 Deepseek(270억 개의 파라미터), GPT-4 Vision Turbo + Amazon Textract OCR(상위 34위), Baidu(상위 22위)와 같은 많은 빅테크 모델들을 능가했습니다.

이번 성과는 확장성 매개변수를 쫓는 대신 핵심 기술을 숙달하고 베트남의 인프라 조건에 맞게 모델을 최적화하는 데 집중하는 실용적인 접근 방식을 보여줍니다.

이미지-2.jpg

대학교 입학 지원서 예시

이미지-3.jpg

위 이미지의 필체를 분석하여 해당 텍스트를 식별했습니다.

CMC 테크놀로지 그룹의 회장 겸 최고경영자인 응우옌 쭝 찐(Nguyen Trung Chinh) 회장은 “이는 10년 이상 기술 연구 개발(R&D)에 꾸준히 투자해 온 결과입니다. 국제 기술 분야에서 CMC가 거둔 높은 성과는 베트남 기술을 선도하고 인공지능(AI)으로의 전환 및 글로벌 시장 진출을 지향하는 우리의 전략을 뒷받침합니다. 우리는 베트남의 인공지능이 세계적인 빅테크 기업들과 충분히 경쟁할 수 있으며, 세계 기술 지도에서 가치 있는 위치를 차지할 수 있다고 확신합니다.”라고 강조했습니다.

CATI-VLM은 법률 문서 검토용 가상 비서인 CLS, 디지털 문서 변환 플랫폼인 CMC SmartDoc, 지식 관리 시스템인 CMC KMS, 스마트 오피스용 자동 보고 시스템, 차세대 Agentic Documents 애플리케이션 등 C.OpenAI 제품 생태계에 적용될 예정입니다.

광회

출처: https://nhandan.vn/cmc-dat-top-12-the-gioi-ve-nhan-dang-van-ban-post891252.html


태그: CMCCMC Corp

댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 태그

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
사원 현관에서

사원 현관에서

시골 시장의 색깔들

시골 시장의 색깔들

꽃