Vietnam.vn - Nền tảng quảng bá Việt Nam

젊은 엔지니어가 인공지능을 활용해 베트남어 입력 방식을 바꾸고 있습니다.

AI가 통합된 베트남어 키보드는 창의성과 전문성을 성공적으로 결합하여 지역 사회에 실질적인 가치를 제공하는 것을 목표로 하는 제품 중 하나입니다.

ZNewsZNews14/05/2025


v7의 인터페이스, AI 통합 키보드. 사진: 저자 제공 .

Znews의 Tri Thức 과의 인터뷰에서 Tri Duc(2003년생)은 인공지능을 활용하여 베트남어 입력 방식을 혁신하려는 자신의 아이디어를 밝혔습니다. 그의 v7 키보드 프로젝트는 연구 논문으로 발전하여 권위 있는 AI 학회인 IJCAI 2025에 채택되었습니다.

수십 년 동안 널리 사용되어 온 텔렉스(Telex) 또는 VNI 입력 방식은 사용자 경험 측면에서 여전히 많은 한계를 가지고 있습니다. 따라서 v7은 인공지능(AI)을 통합하여 베트남어 입력 시간을 단축하는 경량 예측 입력 도구로 개발되었습니다.

언어와 기술에 대한 열정.

언어와 기술에 대한 그의 열정은 Duc이 호치민시 공업대학교에서 응용 인공지능을 전공하게 된 계기가 되었습니다.

그는 학업 기간 동안 베트남어 대규모 언어 모델링(LLM), 소수 민족 언어 번역 소프트웨어, 학생 모집 지원 챗봇 등의 프로젝트에 참여했습니다. "이러한 경험들은 탄탄한 지식 기반을 구축하고, 열정을 키우고, 인공지능을 활용하여 지역 사회에 도움이 되는 제품을 만들고자 하는 열망을 불태우는 데 도움이 되었습니다."라고 그는 말했습니다.

AI가 통합된 나무판 이미지 1

트리덕은 인공지능을 적용하여 삶에 가치를 더하는 것을 목표로 합니다. 사진: 인터뷰 대상자 제공.

게다가, 중국어와 광둥어에 능통한 Duc은 병음/주트핑과 베트남어 표기법 사이의 상관관계를 파악했습니다. 이는 한자의 복잡성과는 달리, 중국 병음 입력 방식은 "yn" 하나만 입력하면 베트남어 이름을 한자로 표기할 수 있다는 것을 보여줍니다. 반면, 텔렉스나 VNI는 "베트남"을 입력하는 데 10개의 키를 눌러야 합니다.

듀크는 관찰을 통해 빠른 대화에서 사람들이 종종 첫 자음을 유지하여 단어를 줄여 쓰는 것을 발견했습니다. 예를 들어 "학생"을 "hs"라고 줄여 쓰는 식입니다. 그는 자신의 아이디어가 나오게 된 배경에 대해 "인간이 이런 쓰기 방식을 쉽게 이해할 수 있다면, 인공지능도 적절한 데이터로 훈련시키면 당연히 이해할 수 있을 것"이라고 설명했습니다.

텔렉스나 VNI처럼 모든 문자를 입력하고 발음 구별 기호를 추가하는 기존 입력 방식과는 달리, v7은 인공지능(AI)을 활용하여 사용자가 입력하려는 단어를 제안합니다. 이 기술은 최소한의 키 입력으로 정확한 단어를 예측하여 입력을 완료합니다.

베트남어 표기법에서 단어는 초성, 모음, 성조로 구성됩니다. 예를 들어, "Nguyễn"이라는 단어는 "ng", "uyên", 그리고 하강 성조로 이루어져 있습니다. 이러한 원리를 바탕으로, v7 입력 방식은 초성과 성조만을 이용하여 단어 전체를 예측함으로써 정확도를 유지하면서 키 입력 횟수를 크게 줄였습니다.

인공지능에게 베트남어를 가르치는 것의 어려움.

Duc에 따르면 가장 큰 어려움은 이 입력 방식을 사용하기 위해 AI가 베트남어를 "이해"하도록 가르치는 것이었습니다. 그는 GPT-2를 기반으로 선택하기 전에 여러 모델을 시도했는데, GPT-2의 트랜스포머 아키텍처는 뛰어난 문맥 이해력과 정확한 단어 예측 기능을 제공했기 때문입니다.

기본 아키텍처를 선택한 후, Duc은 토크나이저(어휘 인코더)를 자신이 직접 만든 베트남어 어휘 세트로 완전히 교체했습니다. 그는 모든 유효하고 철자가 정확한 베트남어 단어를 필터링하여 포함시킴으로써 포괄적인 처리 능력과 사용자가 입력하려는 모든 단어를 예측할 수 있는 기능을 확보했습니다.

또 다른 과제는 예측 성능과 응답 속도 사이의 균형을 맞추는 것입니다. 즉, 모델이 컴퓨터와 휴대폰 모두에서 실시간으로 실행될 수 있으면서도 최상의 예측 결과를 제공할 수 있을 만큼 강력해야 합니다. 두 달간의 지속적인 테스트 결과, 현재 버전은 사용자가 입력한 단어의 약 70%를 상단에 정확하게 배치하며, 지연 시간은 단 0.03초에 불과합니다.

키보드 입력 방식과 관련하여, Duc이 언어학자 Cao Xuan Hao와 Henri Maspero의 연구를 참고한 바에 따르면 베트남어는 6개가 아니라 최대 8개의 성조를 가지고 있습니다. 이러한 특징을 활용하기 위해 v7은 일반적인 6성조(평성 1개와 강세 5개: 첨성, 중성, 의문사, 물결표, 점) 대신 8성조 체계를 사용합니다. 이 키보드에서 "v7"을 입력하면 "Viet"이라는 단어를 제안해 줍니다. 제품 이름에도 이러한 아이디어가 담겨 있습니다.

Duc은 자신의 소셜 미디어에 v7을 공유한 후, 모델이 많은 관심과 지지, 그리고 사용해보고 싶다는 반응을 얻어 매우 기쁘고 놀랐다고 말했습니다. 그는 "이를 통해 더 스마트하고 빠른 베트남어 입력 방식에 대한 필요성을 분명히 느꼈습니다."라고 덧붙였습니다.

AI가 통합된 나무 보드(이미지 2)

해당 과학 연구 논문의 저자들. 왼쪽부터 낫캉, 히에우 응이아, 트리득. 사진: 저자 제공.

현재 입력 방식은 아직 프로토타입 단계이며, 프로그래머와 기술 사용자들이 테스트하고 기여할 수 있도록 GitHub에 오픈 소스 코드가 공개되어 있습니다. 일반 사용자를 위해 Windows 및 macOS용 정식 애플리케이션 버전도 개발 중이며, 설치 및 사용이 간편해질 것입니다.

향후 v7의 최우선 과제는 아이폰 키보드 버전으로, 스마트폰에서 베트남어 텍스트를 입력하는 방식을 개선하는 것입니다. 또한, 일상 대화 데이터를 추가로 학습시켜 모델의 정확도를 높이고, AI가 일반적인 맥락을 더 잘 이해하도록 할 예정입니다.

Duc의 여정은 베트남의 AI 인프라에 대한 강력한 투자라는 맥락 속에서 기술 트렌드에 발맞춰 혁신의 물결을 일으키는 데 기여했습니다. 그가 가장 자랑스러워하는 순간은 v7이 처음으로 완전한 문장을 만들어냈을 때입니다. Duc은 "당시에는 오늘날 ChatGPT의 1/10000 크기에 불과한 작은 모델이 인간처럼 생각할 수 있었습니다."라고 말했습니다.

출처: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


댓글 (0)

댓글을 남겨 여러분의 감정을 공유해주세요!

같은 태그

같은 카테고리

같은 저자

유산

수치

기업들

시사

정치 체제

현지의

제품

Happy Vietnam
조국의 안보를 위하여

조국의 안보를 위하여

국기 아래 자유와 행복

국기 아래 자유와 행복

베트남이 챔피언입니다.

베트남이 챔피언입니다.