
최근 미국 하와이에서 열린 국제 컴퓨터 비전 컨퍼런스(ICCV 2025)의 일환으로 AI 시티 챌린지 2025(AI in smart cities) 결과 발표식이 진행되었습니다. 2024년 우승에 이어 올해 VNPT 의 AI 엔지니어링 팀은 "엣지 디바이스에서 초광각 카메라 이미지 데이터를 이용한 객체 처리 및 인식(엣지 AI)" 부문에서 1위를 차지했습니다. 이 과제는 소형 하드웨어 장치에서 실시간 처리 속도를 제공하는 동시에 고도로 왜곡된 이미지 데이터에서 객체를 인식하는 높은 정확도를 보장하여 실질적인 요구를 충족하는 AI 시스템을 요구합니다.
AI 시티 챌린지 2025는 스마트 시티에 적용되는 인공지능(AI) 분야에서 세계적 으로 권위 있는 연례 대회 중 하나입니다. 올해 대회는 이전 시즌보다 난이도가 높아진 4개 부문으로 구성되었으며, 미국, 중국, 한국, 대만 등 AI 개발이 활발한 국가에서 3만 개 이상의 팀이 참가했습니다.
VNPT의 엔지니어링 팀은 엣지에서 AI의 정확성과 처리 속도를 활용하여 선두를 달리고 있습니다.
엣지에서 AI 역량을 강화하는 과제
초광각 카메라 이미지 데이터에서 객체를 처리하고 인식하는 문제는 2024년부터 AI 시티 챌린지에 포함되어 왔으며, 이는 현재 교통 모니터링 시스템에 컴퓨터 비전을 적용하는 추세를 반영합니다. 높은 실용성으로 인해 이 부문은 항상 전체 대회에서 가장 많은 팀이 참여하는 경쟁입니다. 올해는 왜곡되고 변형된 이미지를 정확하게 처리하는 것 외에도 모델이 엣지 디바이스에서 효과적으로 작동할 수 있도록 전체 프로세스를 최적화해야 하기 때문에 부문의 난이도가 더욱 높아졌습니다.
VNPT 엔지니어링 팀은 차량을 빠르고 정확하게 식별하기 위해 다양한 기술을 적용합니다.
각 팀은 데이터 수집 지점(엣지 장치라고 함)에 위치한 소형 장치인 Jetson Orin에서 효율적으로 실행되도록 모델을 최적화해야 했습니다. Jetson Orin은 전력 제한이 30W이고 중앙 서버보다 컴퓨팅 성능이 훨씬 낮습니다. 따라서 팀은 지나치게 큰 모델을 사용할 수 없었지만, 더 빠르게 실행하고 리소스 사용량을 줄이면서도 차량을 정확하게 인식할 수 있도록 프로그램을 간소화하고 최적화해야 했습니다. 이러한 변화로 인해 AI City Challenge 2025는 역대 가장 어려운 시즌 중 하나가 되었는데, 특히 각 팀이 작년 경험을 통해 배우고 경쟁 수준이 크게 높아졌기 때문입니다.
실제 모델 최적화 경험의 이점을 누리세요
교통 모니터링 문제에서 컴퓨팅 인프라와 네트워크 연결은 종종 제한적이기 때문에 정확하고 효율적인 AI 모델 개발이 큰 과제가 됩니다. 이는 Edge AI가 필연적인 트렌드가 된 이유이기도 합니다. 모든 데이터를 중앙 서버로 전송하여 처리하는 대신, 모델을 카메라와 같은 수집 장치에 직접 배치하여 응답 속도를 높이고 지연 시간을 줄이며 대역폭을 절약하고 데이터 보안을 보장하는 데 도움이 됩니다. 특히 대규모 모니터링 시스템에서 이러한 이점이 있습니다.
AI City Challenge 2025에서 발표된 결과에 따르면, VNPT 엔지니어링 팀은 전 세계 주요 기술 기업, 연구소, 대학의 수백 개 팀을 제치고 1위를 차지했습니다. 이러한 성과는 초광각 카메라가 광범위하게 배치되어 관측 영역 확대, 사각지대 감소, 설치 장치 수 감소, 도시 인프라 운영 효율성 향상을 위해 사용되고 있는 국가의 교통 모니터링 및 도시 보안을 위한 AI 생태계 강화에 기여합니다. VNPT 엔지니어링 팀은 7년 이상의 영상 처리용 AI 모델 개발 및 국내 구축 경험을 바탕으로 실제 환경에서 AI 적용의 효과를 결정하는 요소인 정확성, 속도, 운영 비용의 균형을 맞추는 역량을 축적했습니다.

VNPT 팀은 40개 이상의 이미지 처리 AI 모델을 개발하고 완성했습니다.
현재 VNPT 팀은 차량 번호판 인식, 교통 흐름 측정, 헬멧 감지 등 40개 이상의 다양한 이미지 처리 AI 모델을 개발하고 숙달했으며, 베트남 특화 모델로는 3인승 차량 감지, 대형 화물 운송 감지, 보안 및 도시 감시 분야의 화재 및 무기 감지 등이 있습니다. 이러한 모델은 GPU, CPU, NPU 등 다양한 하드웨어에서 작동하도록 최적화되어 있어 시스템과 고객의 다양한 요구 사항을 충족합니다.
특히 온프레미스 모델과 수백 대의 카메라가 동시에 작동하는 엣지 환경에서 대규모로 효과적으로 구축하기 위해 VNPT 엔지니어들은 수백 개의 비디오 데이터 스트림을 동시에 처리할 수 있는 최적의 처리 방식을 구축했습니다. 이러한 접근 방식은 AI 솔루션의 확장성을 높이고 리소스를 절약하며 다양한 지역의 인프라 조건에 적합합니다.
이러한 경험을 AI City Challenge 2025에 적용하여, 연구팀은 모델 압축을 통한 크기 및 처리 리소스 감소, 이미지 처리 흐름 최적화를 통한 지연 시간 단축, 그리고 프로그래밍 언어 및 코드 구조 개선을 통한 최고의 성능을 위한 전체 처리 체인 구축 등의 기술을 조합하여 적용했습니다. 이러한 접근 방식은 모델의 정확도를 유지하면서 추론 속도와 하드웨어 제약이 있는 엣지 디바이스에서의 배포 속도를 높이는 데 도움이 됩니다.
다학제 딥러닝 AI 연구 플랫폼
VNPT가 국제 표준을 충족하고 권위 있는 대회에서 높은 상을 수상하는 포괄적인 AI 제품 생태계를 갖추기 위해 중요한 전제 중 하나는 젊고 재능 있는 직원과 강력한 컴퓨팅 인프라를 보유하고 있을 뿐만 아니라, 다양한 분야에서 심층적인 AI 연구 플랫폼을 보유하고 있다는 것입니다.
VNPT는 스마트 도시 및 교통 시스템 외에도 이미지 처리 분야의 AI 응용 분야를 의료 분야 연구 응용 분야로 확대하고 있습니다. 2025년 9월, VNPT는 의학 분야 AI 및 컴퓨터 비전 분야의 세계 최고 학회인 MICCAI 2025에서 관련 연구를 발표했습니다. 이 연구는 4년간 전국 3개 지역에서 약 1만 명의 환자 데이터를 기반으로 갑상선암 진단 분야의 AI 응용 분야에 중점을 두었습니다. 이 프로젝트는 국내 인구 특성 및 건강 상태에 적합한 자동 진단 지원 시스템 개발에 핵심적인 역할을 수행하여 정확도 향상, 진단 시간 단축, 의사 업무량 감소, 그리고 양질의 의료 서비스 접근성 확대에 기여할 것입니다.
VNPT의 AI 엔지니어링 팀은 많은 권위 있는 과학 컨퍼런스에서 연구 결과를 발표했습니다.
언어 및 음성 처리 분야에서 VNPT는 자연어 처리 AI 컨퍼런스인 EMNLP 2025(A* 등급)와 음성 처리 AI 컨퍼런스인 ICASSP 2025(A1 등급)에서 연구 결과를 발표했습니다. 이러한 연구들은 대규모 언어 모델(LLM) 및 생성 AI 개발에 고급 머신러닝 기법을 적용하여, AI 모델이 베트남어 맥락, 감정, 그리고 미묘한 뉘앙스를 이해하는 능력을 향상시키는 것을 목표로 합니다. 이러한 요소들은 복잡하고 국제 코퍼스에서는 거의 모델링되지 않습니다. 덕분에 베트남어는 글로벌 NLP 연구 커뮤니티에서 점점 더 중요한 위치를 차지하고 있으며, 베트남어 사용자들을 위한 강력하고 독특하며 적합한 언어 모델을 구축할 가능성을 열어주고 있습니다.
출처: https://vnpt.com.vn/gioi-thieu/tin-tuc/nhom-ky-su-tre-viet-nam-hai-nam-lien-tiep-dung-dau-san-choi-ai-toan-cau.html






댓글 (0)