Vietnam.vn - Nền tảng quảng bá Việt Nam

루 안 투안 부교수의 'AI 주권'에 대한 꿈과 대규모 베트남어 모델 구축에 대한 그의 확고한 의지.

DNVN - 싱가포르에서 17년간 근무 후 베트남으로 돌아온 루 안 투안 부교수(빈유니 대학교 인공지능(AI) 연구센터 소장)는 "AI 주권"을 유지하기 위해 "메이크 인 베트남" 대규모 언어 모델(LLM)을 구현하고자 하는 열망을 품고 있습니다.

Tạp chí Doanh NghiệpTạp chí Doanh Nghiệp16/02/2026


루 안 투안 부교수 - VinUni 대학교 인공지능(AI) 연구센터 소장.

루 안 투안 부교수 - VinUni 대학교 인공지능(AI) 연구센터 소장.

외국 인공지능이 베트남어의 복잡성에 직면하여 "포기"할 때.

베트남이 'AI 활용' 국가에서 'AI 창조' 국가로 급부상하는 상황에서, 루 안 투안 부교수는 ChatGPT와 같은 해외 모델에 전적으로 의존하는 것은 상당한 위험을 수반한다고 주장합니다. 이러한 도구들이 베트남어를 지원하기는 하지만, 현지 문화와 맥락에 대한 깊이 있는 이해 부족으로 인해 품질 면에서 여전히 기대에 미치지 못한다는 것입니다.

투안 부교수가 지적한 가장 큰 어려움은 베트남어의 복잡성에 있다.

"베트남어는 세계 여러 언어와 비교했을 때 독특한 특징이 많습니다. '이모, 삼촌, 조부모'와 같은 호칭조차도 매우 복잡해서 전 세계의 일반적인 AI 시스템으로는 이해할 수 없습니다."라고 루 안 뚜안 부교수는 말했습니다.

게다가 베트남 북부, 중부, 남부 세 지역 간의 방언 다양성과 특정한 역사적 요인들은 일반적인 데이터로 훈련된 국제 모델들이 정보를 처리할 때 종종 문제를 겪는 "사각지대"이기도 합니다.

"만약 우리가 ChatGPT에 계속 문의하고 비용을 지불한다면, 인공지능을 개발하는 것이 아니라 AI를 활용하는 데 그칠 뿐입니다."라고 루 안 투안 부교수는 강조했습니다.

이는 디지털 주권 및 인공지능 주권과 관련된 시급한 문제를 제기하며, 베트남이 외국에 대한 의존을 피하기 위해 기술적 자립을 달성해야 한다는 압박을 가하고 있다.

베트남이 자체적인 대규모 언어 모델을 구축하는 데 있어 오늘날 가장 큰 과제는 데이터입니다. 투안 부교수는 "베트남의 데이터는 부족할 뿐만 아니라 여러 곳에 흩어져 있다"고 솔직하게 인정합니다.

현재 데이터 수집은 주로 연구 그룹들이 인터넷에서 데이터를 독립적으로 수집하고 수동으로 필터링하는 방식에 의존하고 있으며, 대규모 데이터 처리를 전문으로 하는 기업은 없습니다. 더욱이 베트남은 국내 문화적 맥락에 맞춰 언어 모델의 정확성과 신뢰성을 측정할 수 있는 표준화된 평가 기준이 부족합니다.

이러한 상황을 고려하여 투안 부교수는 정부가 "지휘자" 역할을 수행하여 보건, 법무, 교육 등 다양한 부처와 분야의 데이터를 통합하는 국가 데이터 센터를 설립함으로써 자원 낭비를 방지하고 일관성을 확보해야 한다고 제안했습니다. 또한, "깨끗한" 데이터 목록을 검증하는 통합 기관을 설립하여 향후 개발자들이 안전하게 데이터를 활용할 수 있는 기반을 마련해야 한다고 주장했습니다.

"오픈 소스" 전략과 기여하고자 하는 열망.

수많은 어려움에도 불구하고, 난양공과대학교(NTU 싱가포르) 부교수의 신념과 의지는 놀라울 정도로 강했습니다. 17년간의 해외 유학 및 연구 활동 후, 투안 부교수는 즈엉 응우옌 부 교수의 초청을 받아들여 싱가포르 빈대학교 인공지능 연구센터 소장으로 부임하기로 결정했습니다.

귀국 이유를 밝히면서 그는 "사실 저처럼 해외에 사는 베트남 사람들은 언제나 조국에 봉사하기 위해 돌아오고 싶어 합니다."라고 말했습니다. 그는 이번 귀국을 국제적인 지식 교류와 베트남 인재 양성을 연결하는 기회로 보고 있습니다. 현재 싱가포르 난양공과대학교(NTU)와 빈대학교(VinUniversity) 간의 유연한 협력 체계를 활용하여 베트남 학생들이 해외에서 유학하고, 반대로 베트남 학생들이 베트남에서 유학할 수 있도록 가교 역할을 하는 데 힘쓰고 있습니다.

투안 부교수가 추구하는 전략은 폐쇄적인 모델을 만드는 것이 아니라 오픈 소스로 만드는 것입니다.

"베트남은 중소기업과 지역 사회가 이를 계승하고 발전시켜 강력한 AI 생태계를 구축할 수 있도록 오픈 소스 모델에 집중해야 합니다."라고 투안 씨는 논평했습니다.

그는 또한 안전, 책임, 개인정보 보호, 공정성, 투명성이라는 다섯 가지 핵심 요소에 기반한 "신뢰할 수 있는 AI" 구축을 강조했습니다.

"베트남의 장점은 후발주자로서 가짜 뉴스가 만연한 구식 데이터 시스템에 얽매이지 않고 처음부터 윤리적 기반을 구축할 수 있다는 점입니다."라고 루 안 투안 부교수는 말했다.

루 안 투안 부교수에 따르면, 대규모 "메이크 인 베트남" 언어 모델 구축 여정은 단순한 기술 경쟁이 아니라 문화적, 지적 주권에 관한 이야기이기도 합니다. 값비싸고 문화적으로 부적절한 외국산 "블랙박스"에 계속 의존하는 대신, 베트남은 신뢰할 수 있고 투명하며 오픈소스인 AI 생태계를 구축할 절호의 기회를 맞이하고 있습니다. "후발 주자"라는 이점을 활용하여 처음부터 윤리적 기준을 정립할 수 있고 정부의 협력까지 확보한다면, 투안 부교수는 베트남이 2030년까지 "AI를 사용하는 국가"에서 "AI를 창조하는 국가"이자 지역의 선도 국가로 발돋움하는 것이 충분히 가능하다고 확신합니다.


히엔 타오

출처: https://doanhnghiepvn.vn/cong-nghe/giac-mo-chu-quyen-ai-va-quyet-tam-xay-dung-mo-hinh-ngon-ngu-lon-tieng-viet-cua-pgs-luu-anh-tuan/20260216100302351


댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 태그

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
지역사회 활동

지역사회 활동

할머니와 손녀

할머니와 손녀

드넓은 바다 한가운데에서

드넓은 바다 한가운데에서