전 세계적으로 인공지능(AI)에 대한 관심이 높아지고 있으며, 특히 미국과 중국처럼 AI 기술을 선도하는 국가들에 관심이 집중되고 있습니다. 세계 주요 경제권 중 하나인 동남아시아는 점차 새로운 AI 허브로 부상하고 있으며, 정책 입안자, 투자자, 그리고 전 세계 기술 전문가들의 주목을 받을 만한 상당한 발전을 이루고 있습니다.

베트남에서는 당과 정부가 과학 기술혁신 및 국가디지털변혁에 관한 결의안 57-NQ/TW에서 보여주듯이, 국가의 기술 발전 시대를 주도하고 촉진하겠다는 의지를 분명히 하고 있습니다. 이러한 방향성은 국내 기술 기업들이 세계 선진 기술의 잠재력에 투자하고 활용하도록 강력한 동기를 부여하고 있습니다.
현재 베트남은 동남아시아에서 자체 개발한 대규모 언어 모델(LLM)을 보유한 몇 안 되는 국가 중 하나입니다. 특히, 잘로(Zalo)는 2023년부터 베트남 엔지니어 팀이 연구 및 개발한 베트남어 특화 LLM 모델을 성공적으로 학습 및 출시해 왔습니다.
처음부터 다시 훈련을 시작하면 놀라운 결과를 얻을 수 있습니다.
현재 AI 모델은 두 가지 학습 기법을 사용합니다. 첫 번째는 미세 조정 모델링으로, 이전에 학습된 LLM을 최적화하여 특정 목적에 맞는 새로운 LLM을 생성하는 방식입니다. 두 번째는 처음부터 모델링하는 방식으로, 매개변수 초기화 및 모델 아키텍처 결정부터 주어진 데이터 세트에 대한 알고리즘 학습에 이르기까지 완전히 새로운 모델을 구축하는 과정입니다.
이러한 기법들 중에서도, 미세 조정 기법은 구현의 용이성, 자원 절약, 그리고 더 나은 결과를 가져올 가능성 등의 장점 때문에 많은 기업에서 선택하고 있습니다. 특히 훈련 장비와 데이터가 제한적인 베트남의 상황에서는 미세 조정 기법이 더욱 효과적인 해결책입니다.
하지만 잘로는 처음부터 자체적으로 훈련하는 방식을 택했습니다. 이 방식을 통해 전체 훈련 과정과 모델은 베트남 사람들이 완전히 소유하고 관리하게 되었습니다. 그 결과, 베트남은 동남아시아에서 자체 개발한 대규모 언어 모델(LLM)을 보유한 몇 안 되는 국가 중 하나가 되었습니다.
2023년 출시 당시, 잘로(Zalo)의 첫 번째 대규모 언어 모델은 70억 개의 파라미터를 탑재하고 베트남어에 초점을 맞춰 개발되었으며, 베트남어 LLM 역량 평가 기준인 VMLU에서 오픈AI의 GPT3.5 대비 150% 향상된 성능을 보였습니다. 학습 기간은 당초 예상했던 18개월보다 훨씬 짧은 6개월 만에 완료되었으며, 이는 잘로 개발팀조차 놀라게 한 결과였습니다.

잘로의 LLM 모델은 2023년 처음 출시되었을 때 카훗 챌린지에서 3위를 차지했습니다(사진: 잘로).
2024년, 130억 개의 매개변수를 보유한 Zalo의 모델은 VMLU의 베트남어 LLM 숙련도 순위에서 초보자 수준 교육용 베트남어 LLM 모델 부문 2위를 차지하며 세계적인 주요 기업들을 제쳤습니다.
이번 연구 결과는 베트남의 대규모 언어 모델링 훈련 수준이, 특히 개발 초기 단계의 어려움을 고려했을 때, 세계적 수준의 AI 모델 개발 역량과 견줄 만하다는 것을 보여줍니다.
베트남 국민들의 인공지능 모델 개발 노력.
잘로(Zalo) 관계자에 따르면, LLM 프로그램 교육에는 교육 장비, 데이터, 기술 전문성이라는 세 가지 핵심 요소가 필요합니다. 과거 베트남은 이 세 가지 영역 모두에서 상당한 제약을 받았습니다. 특히, 세계적인 대기업들이 엔비디아의 최신 고성능 GPU를 수천 대씩 보유하고 있는 반면, 베트남 엔지니어들은 필요한 서버 인프라가 부족했습니다. 또한, 베트남의 데이터 풀은 영어권이나 중국어권에 비해 훨씬 부족했습니다. 더 나아가, 베트남의 LLM 교육 관련 인적 자원과 경험 역시 선진국에 비해 현저히 부족했습니다.
당시 Zalo 팀은 대규모 컴퓨팅 인프라가 구축되는 즉시 사용할 수 있도록 LLM에 필요한 지식과 학습 능력을 신속하게 확보하기 위해 소형 소비자용 GPU를 사용하여 연구 및 실험을 진행해야 했습니다.
AI 학습용 칩이 부족하기 때문에 Zalo는 엔비디아 DGX H100 서버 8대를 주문했지만, 모든 장비를 한 번에 받을 수 없어 제조업체의 배송을 순차적으로 기다려야 합니다. 따라서 불완전한 컴퓨팅 인프라를 최적화하여 학습 시간을 최대한 활용하는 것 또한 Zalo 팀이 해결해야 할 과제입니다.
동시에 베트남어 데이터 소스의 부족을 보완하기 위해 고품질 학습 데이터 개발에 투자가 이루어지고 있습니다.

"글로벌 대기업에 비해 상당한 어려움에 직면했음에도 불구하고, 잘로는 베트남에서 자체 AI 모델을 성공적으로 개발하겠다는 목표로 시장 진출을 결정했습니다. 이를 위해 전 세계 유수의 연구기관 연구원 및 엔지니어들과 협력하여 적절한 전략을 수립했습니다."
"지금까지 이뤄낸 성공은 잘로 엔지니어들에게 더 많은 데이터를 더하고 더 나은 품질을 확보하기 위해 모델을 지속적으로 최적화하도록 동기를 부여합니다. 동시에, 우리는 이 모델의 응용 분야를 활용하여 베트남 사용자들을 위한 더욱 세계적인 수준의 AI 제품을 개발하고 있습니다."라고 잘로 AI의 과학 부문 책임자인 응우옌 쯔엉 손 박사는 밝혔습니다.

잘로는 엔비디아로부터 DGX H100 서버를 주문했습니다(사진: 잘로).
잘로는 개발 초기 단계의 어려운 여건 속에서도 유연하게 적응해 온 덕분에 점진적으로 성공적인 이정표를 달성하며 오늘날과 같은 글로벌 AI 기술을 선도하는 기업으로 성장했습니다.
현재 잘로의 AI 모델은 연구 및 훈련 분야에서 성공을 거두었을 뿐만 아니라 실제 적용 분야에서도 활약하며 베트남 국민들이 첨단 신기술의 가치를 접하고 활용할 수 있도록 지원하고 있습니다.
올해 초, 잘로는 공식 계정(OA)으로 운영되는 종합 Q&A 도우미인 키키 인포(Kiki Info)를 출시했습니다. 이 도우미는 생활, 콘텐츠 제작, 엔터테인먼트 등 다양한 주제에 대한 Q&A를 지원합니다. 잘로의 통계에 따르면, 키키 인포는 출시 후 두 달도 채 되지 않아 100만 명의 사용자가 잘로의 공식 계정(OA)을 이용하고 있습니다.

잘로의 LLM 모델은 키키 정보 도우미 개발에 적용되었습니다(사진: 잘로).
잘로의 LLM 모델을 활용한 또 다른 애플리케이션은 AI 기반 인사 카드입니다. 이 서비스는 단 두 달 만에 1,500만 장의 카드를 제작 및 전송하는 성과를 달성했습니다. 특히, 중요한 날에 가족과 친구들에게 인사를 전할 수 있는 AI 인사 카드는 잘로 사용자들 사이에서 큰 인기를 얻고 있습니다.
현재 잘로는 방대한 언어 모델을 기반으로 애플리케이션을 지속적으로 확장 및 개발하고 있으며, 국내 사용자들에게 많은 유용한 이점을 제공할 것으로 기대됩니다.
출처: https://dantri.com.vn/cong-nghe/zalo-phat-develop-ai-do-nguoi-viet-lam-chu-20250616161352610.htm








댓글 (0)