Vietnam.vn - Nền tảng quảng bá Việt Nam

Zalo와 국내의 열망을 이루기 위해 장애물을 극복하는 여정

전 세계가 초강대국의 AI 분야에서 급속한 진전을 지켜보는 가운데, Zalo 기술 엔지니어링 팀은 야심찬 여정을 시작합니다. 바로 베트남어로 인공지능을 마스터하는 것입니다.

ZNewsZNews18/06/2025


잘로 형 1

생성적 AI의 폭발적인 성장은 글로벌 기술 환경을 완전히 바꾸어 놓았습니다.

잘로 형제 2

OpenAI가 2022년 말에 ChatGPT를 출시한 이후, 의료, 교육 , 금융, 법률 등 여러 분야에 적용되는 유사한 LLM 모델이 지속적으로 등장했습니다. 기업 규모뿐만 아니라 국가 규모에서도 교육 용량, 컴퓨팅 인프라, 데이터 측면에서 경쟁이 치열해졌습니다.

OpenAI, Google, Meta, Microsoft 등 재정적 잠재력과 유리한 조건을 갖춘 대기업들은 모두 LLM 모델 학습의 핵심 요소인 Nvidia H100과 같은 수천 대의 고성능 GPU를 보유하기 위해 수십억 달러를 "빠르게" 투자했습니다. 이 기간 동안 Nvidia의 주가는 급등했는데, 이는 전 세계 의 인프라에 대한 갈증을 반영한 것입니다.

잘로 형제 3


한편, 개발도상국의 기술 기업들은 비용 문제 외에도 미국산 AI 칩 장비의 수입 및 수출에 제약을 받고 있습니다. 이로 인해 교육 장비 부족과 기술 대기업에 비해 "느린" 개발 속도가 발생합니다. 국내 시장 진출을 목표로 하는 Zalo도 예외는 아닙니다.

잘로 안 4


데이터 측면에서, 이전 머신 러닝 문제들은 방대한 양의 학습 데이터를 필요로 했지만, 대규모 언어 모델의 경우 이는 엄청난 양의 데이터입니다. LLM 시스템은 충분히 좋은 모델을 구축하기 위해 수백억 또는 수천억 개의 입력 텍스트 토큰을 필요로 합니다. 한편, 베트남어는 인기 측면에서 영어나 중국어에 미치지 못합니다. 이는 베트남어 LLM 개발자들의 어려움을 배가시켰습니다.

잘로 형제 5


2023년에는 GPT-3.5, GPT-4와 같은 대규모 언어 모델(LLM)이 기술계에 큰 영향을 미쳤으며, 많은 베트남 기업도 단축법을 사용하고 LLM 교육 과정을 앞서 나가기 위해 해외에서 제작된 정밀 조정 모델을 선택했습니다.

Zalo는 다른 길을 선택했습니다. 더 힘들지만 더 자율적인 방식이었습니다. 바로 처음부터 모델을 자체 학습하는 것이었습니다. 데이터, 모델 아키텍처, 전체 학습 프로세스에 이르기까지 모든 것을 처음부터 구축해야 하는 방식이었습니다. 이러한 결정은 거대 기업과 경쟁하기 위한 것이 아니라, 베트남 국민의 열망, 즉 모국어로 LLM 모델을 숙달하는 것을 실현하기 위한 것이었습니다.

잘로 형제 6


"우리는 어려움을 예상했지만, 그럼에도 불구하고 일찍 시장에 뛰어들기로 결정했습니다. '거대 기업'과 직접 경쟁하는 대신, 더 나은 성과를 낼 수 있는 틈새 시장을 선택했습니다. 우리의 목표는 베트남 국민이 데이터부터 알고리즘까지 완벽하게 통제할 수 있는 모델을 구축하는 것입니다." Zalo AI의 최고 과학 책임자(CSO) 응우옌 트롱 손 박사의 말입니다.

인프라, 데이터, 교육 수준 등 세 가지 주요 요소에서 많은 어려움에 직면했음에도 불구하고, 베트남 엔지니어들은 어려움을 극복할 해결책을 적극적으로 찾아냈습니다. 이는 어려운 상황 속에서도 베트남 국민의 정신과 의지를 보여주는 사례이며, 특히 이번 사례에서는 베트남 국민을 위한 LLM 개발 과정에서 어려움을 극복해 나간 것을 보여줍니다.

잘로 안 7

LLM 교육을 위해 엔지니어들은 적절한 인프라가 필요했습니다. 하지만 당시 엔비디아의 H100과 같은 GPU는 거의 "세계적으로 희귀한" 수준이었습니다. 그동안 대기업들은 1년 동안 사전 주문하고 수백만 달러를 들여 구매했습니다. Zalo는 베트남에서 DGX H100 서버 8대를 구매하려 했지만, 제조업체에서 납품될 때마다 기다려야 했기 때문에 쉽지 않았습니다.

엔비디아 GPU가 없었기에 베트남 엔지니어들은 민간용 GPU를 유연하게 사용하여 각 코드 줄을 실험하고 각 소형 모델을 실행해야 했습니다. 엔지니어들은 기다리기보다는 선제적으로 준비하여 최신 장비가 갖춰지면 모든 것이 준비될 수 있도록 했습니다.

데이터 측면에서 Zalo는 가용 리소스에 의존하는 대신, 영어와 중국어에 비해 심각한 데이터 부족을 보완하기 위해 베트남어 전용 고품질 데이터웨어하우스를 구축하는 데 투자했습니다.

잘로 안 8


Zalo는 유연한 개발 전략 덕분에 대규모 언어 모델 개발 기간을 예상 18개월에서 6개월로 단축했습니다. 2023년 말, Zalo의 베트남어 대규모 언어 모델은 베트남의 주요 기술 및 AI 커뮤니티가 모인 Zalo AI Summit에서 공식 출시되었습니다. Zalo의 LLM 모델은 Tinhte.vn이 주최한 Kahoot 챌린지를 통해 처음 공개되었으며, 당시 세계 최강으로 평가받던 LLM 모델 GPT4에 이어 GPT 3.5를 놀랍게도 넘어섰습니다.

VMLU(Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) 평가 플랫폼에서 Zalo 모델은 OpenAI의 GPT-3.5보다 1.5배 높은 처리 용량을 달성했습니다. 2024년 말까지 이 모델은 GPT-4(OpenAI), Gemma-2-9B(Google), Phi-3-small(Microsoft) 등 주요 모델들을 앞지르며, VMLU 순위에서 베트남어 처리 용량 기준으로는 Meta의 LLaMA-3-70B에 이어 두 번째로 높은 성능을 보일 것으로 예상됩니다.

잘로 형 9


Zalo는 연구에만 그치지 않고, LLM의 응용 제품을 상용화하고 대중화함으로써 점차적으로 연구실의 기술을 현실로 구현하고 있습니다.

잘로 안 10


2025년 초, Zalo 플랫폼의 공식 계정으로 운영된 Q&A 도우미 Kiki Info는 2개월 만에 100만 명 이상의 사용자를 확보했습니다. 또 다른 애플리케이션인 Thiep AI 역시 단 2개월 만에 1,500만 장의 카드를 생성하고 전송하는 놀라운 성과를 달성했습니다.

잘로 안 11


Zalo의 여정은 단순히 기술 개발을 원하는 기업에 국한되지 않습니다. 이는 베트남이 과학, 기술 개발, 국가 디지털 전환에 관한 결의안 57-NQ/TW를 통해 혁신을 적극적으로 장려하고 있는 더 큰 그림의 일부입니다. 특히 인공지능 분야가 강조됩니다.

Zalo의 베트남어 LLM의 등장과 급속한 발전은 기업의 기술적 진보일 뿐만 아니라 베트남 기술팀의 본질적인 역량과 인내심에 대한 증거이기도 합니다.

Zalo는 처음부터 모델을 학습하는 "처음부터"라는 기법을 통해 긴 여정을 선택했지만, 베트남이 AI를 진정으로 마스터할 수 있도록 도왔습니다. 결과뿐만 아니라 모델 아키텍처, 데이터, 알고리즘부터 애플리케이션 제품에 이르기까지 전체 프로세스 측면에서도 마찬가지입니다. Zalo의 성공은 베트남이 국내 LLM 모델을 보유한 몇 안 되는 동남아시아 국가 중 하나가 되는 데 기여했으며, 이는 점점 더 치열해지는 글로벌 기술 경쟁 속에서 전략적 이정표가 되었습니다.

잘로 안 12

Zalo는 앞으로의 긴 여정에서 하나의 모델이나 몇 가지 제품에 그치지 않고, 사용자에게 서비스를 제공하고 경쟁력 있는 베트남 AI 플랫폼을 구축하기 위해 모델을 지속적으로 개선해 나갈 것입니다. 손 사장은 "Zalo의 AI 개발 여정은 아직 깁니다. 우리는 모델의 폭과 깊이를 최적화하는 동시에 실질적인 적용을 촉진해 나갈 것입니다. 궁극적인 목표는 베트남 국민에게 실질적으로 도움이 되는 고품질 AI 제품을 만드는 것입니다."라고 덧붙였습니다.

Zalo의 베트남 LLM(법학 석사) 학위 취득 성공은 단순히 사업의 돌파구를 넘어 베트남 인공지능의 잠재적 미래를 열어줍니다. 베트남 국민의 끈기와 열망은 가치 있는 성과를 향한 여정을 이끌었습니다. 베트남 AI의 미래는 "Zalo"뿐만 아니라, 기술 세계를 따르고, 계승하고, 정복할 용감한 엔지니어 세대를 필요로 할 것입니다.

잘로 안 13


출처: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html


댓글 (0)

No data
No data

유산

수치

사업

No videos available

소식

정치 체제

현지의

제품