Vietnam.vn - Nền tảng quảng bá Việt Nam

베트남 인공지능, 텍스트 인식 분야 세계 12위 진입

CATI-VLM 모델은 2025년 6월에 개최된 국제 Robust Reading Competition(RRC)의 Document Visual Question Answering(DocVQA) 부문에서 세계 12위, 베트남 1위를 차지했습니다.

VietnamPlusVietnamPlus09/07/2025


0907-ai-viet-nam.jpg

베트남에서 디지털 혁신과 인공지능 응용 프로그램 혁신이 활발하게 진행됨에 따라, OCR 기술(광학 문자 인식)은 문서 디지털화, 비즈니스 프로세스 자동화, 비용 절감 및 경영 효율성 향상에 있어 점점 더 중요한 역할을 하고 있습니다.

하지만 악센트와 필기체가 있는 베트남어의 특성을 고려할 때, 인식 문제는 '단어 읽기'에 그치지 않고 모델이 맥락을 종합적으로 이해할 수 있는 능력을 요구합니다.

이러한 과제에 직면하여CMC 기술 응용 연구소(CMC ATI)는 컴퓨터 비전(Visual Document Understanding)을 사용하여 문서를 이해하는 시스템인 CATI-VLM 모델을 개발했습니다.

최대 5TB의 대용량 데이터웨어하우스를 기반으로 하는 이 모델은 2025년 6월에 개최되는 국제 Robust Reading Competition(RRC)의 문서 시각적 질문 답변(DocVQA) 부문에서 세계 12위, 베트남 1위를 차지했습니다.

(베트남 통신/Vietnam+)

출처: https://www.vietnamplus.vn/tri-tue-nhan-tao-viet-vao-top-12-the-gioi-ve-nhan-dang-van-ban-post1048696.vnp


댓글 (0)

No data
No data
푸토의 계단식 논은 완만한 경사를 이루고 있으며, 심기 전 거울처럼 밝고 아름답습니다.
Z121 공장, 국제 불꽃놀이 마지막 밤 준비 완료
유명 여행 잡지가 손동 동굴을 '세계에서 가장 웅장한 동굴'이라고 칭찬했습니다.
서양 관광객을 끌어들이는 신비로운 동굴, 탄호아의 '퐁냐 동굴'과 비교돼
빈히만의 시적인 아름다움을 발견하세요
하노이에서 가장 비싼 차는 1kg당 1,000만 동이 넘는데, 어떻게 가공하나요?
강 지역의 맛
베트남 바다 위로 펼쳐지는 아름다운 일출
투란의 장엄한 동굴 호
연꽃차 - 하노이 사람들의 향기로운 선물

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품