Інтерес світу до штучного інтелекту зростає, причому основна увага зосереджена на країнах з багатьма провідними світовими моделями штучного інтелекту, таких як США та Китай. Південно-Східна Азія – один з важливих економічних регіонів світу – поступово стає новою гарячою точкою для штучного інтелекту, зі значними досягненнями, які можуть зацікавити світових політиків, інвесторів та експертів з технологій.

У В'єтнамі партія та уряд також рішуче налаштовані формувати та сприяти ері технологічного розвитку країни, що продемонстровано в Резолюції 57-NQ/TW про прорив у розвитку науки і технологій, інноваціях та національній цифровій трансформації. Ця спрямованість створила потужну рушійну силу для вітчизняних технологічних підприємств, які прагнуть інвестувати та використовувати потенціал передових світових технологій.
Наразі В'єтнам став однією з небагатьох країн Південно-Східної Азії, яка має власну модель вивчення англійської мови (LLM). Зокрема, з 2023 року Zalo успішно навчає та запускає модель LLM, орієнтовану на в'єтнамську мову, досліджену та повністю розроблену командою в'єтнамських інженерів.
Оберіть навчання з самого початку та отримайте неочікувані результати
Наразі моделі штучного інтелекту мають 2 методи навчання, зокрема: метод точно налаштованої моделі – це метод оптимізації раніше навчених LLM для створення нових LLM для спеціалізованих цілей; метод навчання моделі з нуля – це процес побудови абсолютно нової моделі, від ініціалізації параметрів, вибору архітектури моделі до алгоритму навчання на певному наборі даних.
Серед них багато підприємств обирають методи точного налаштування через їхні переваги, такі як легке впровадження, економія ресурсів та здатність забезпечити кращу ефективність. Особливо в контексті В'єтнаму, де навчальне обладнання та дані обмежені, методи точного налаштування є найкращим рішенням.
Однак, Зало обрав цей метод навчання з самого початку. Завдяки цьому методу весь процес навчання та модель повністю належать і контролюються в'єтнамцями. Завдяки цьому В'єтнам став однією з небагатьох країн Південно-Східної Азії, яка має власну розроблену мовну модель (LLM).
На момент запуску у 2023 році перша великомасштабна мовна модель Zalo з 7 мільярдами параметрів, орієнтованих на в'єтнамську мову, досягла 150% продуктивності порівняно з GPT3.5 OpenAI за шкалою оцінки компетенцій VMLU Vietnamese LLM. Час навчання зайняв лише 6 місяців, що значно менше, ніж початковий план у 18 місяців. Такий швидкий процес навчання здивував всю команду розробників Zalo.

Модель LLM від Zalo посіла 3-тє місце в конкурсі Kahoot під час свого першого запуску у 2023 році (Фото: Zalo).
У 2024 році модель Zalo з 13 мільярдами параметрів перевершить світові імена, підтвердивши свою позицію серед двох найкращих в'єтнамських моделей LLM, які пройшли навчання з нуля, у рейтингу компетенцій VMLU з LLM у В'єтнамі.
Результати показують, що рівень навчання моделей великих мов не поступається світовому для розробки власної моделі штучного інтелекту В'єтнаму, особливо в контексті початкових труднощів розробки.
Зусилля В'єтнаму з розробки моделей штучного інтелекту
Представник Zalo зазначив, що навчання з магістра права (LLM) вимагає 3 основних елементів: навчального обладнання, даних та технічного рівня. Раніше у В'єтнамі все ще існувало багато обмежень у всіх 3 аспектах. Зокрема, хоча великі компанії у світі володіли тисячами новітніх високопродуктивних графічних процесорів від Nvidia, у В'єтнамі інженери досі не повністю оснащені необхідною серверною інфраструктурою. Водночас, в'єтнамці також входять до групи з гіршими ресурсами даних, ніж англійці чи китайці. Людські ресурси та досвід навчання LLM у В'єтнамі також обмежені порівняно з розвиненими країнами.
Команда Zalo на той час мала досліджувати та експериментувати з невеликими цивільними графічними процесорами, щоб отримати знання та можливості навчання LLM, щойно стане доступною велика обчислювальна інфраструктура.
Чіпи для навчання штучного інтелекту є дефіцитними, тому, хоча Zalo замовила 8 серверів Nvidia DGX H100, вона не може володіти всіма пристроями одночасно та повинна чекати на кожну партію доставки від виробника. Тому оптимізація незавершеної обчислювальної інфраструктури для економії часу на навчання також є проблемою, яку команда Zalo повинна вирішити.
Водночас, для компенсації дефіциту в'єтнамських джерел даних також інвестуються кошти в якісні навчальні дані.

«Хоча старт був складним порівняно з великими компаніями світу, Zalo все ж вирішила приєднатися до перегонів з метою успішної розробки власної моделі штучного інтелекту у В'єтнамі. Ми проконсультувалися з дослідниками та інженерами багатьох провідних дослідницьких інститутів світу, щоб розробити відповідну стратегію розвитку».
«Поточні віхи успіху мотивують інженерів Zalo продовжувати оптимізувати модель, щоб вона була більшою за кількістю та кращою за якістю. Водночас, використовувати цю придатність для створення багатьох продуктів штучного інтелекту світового класу для в'єтнамських користувачів», – поділився доктор Нгуєн Труонг Сон, директор з науки Zalo AI.

Сервер DGX H100, замовлений Zalo у Nvidia (Фото: Zalo).
Завдяки гнучкій адаптації на складних ранніх етапах розвитку, Zalo поступово досягла успішних етапів, рухаючись до опанування глобальної технології штучного інтелекту в її сучасному вигляді.
Наразі модель штучного інтелекту Zalo успішна не лише з точки зору навчальних досліджень, але й у застосуванні, сприяючи доступу та використанню цінностей передових нових технологій для в'єтнамського народу.
Раніше цього року Zalo запустив помічника з питань та відповідей Kiki Info, який працює як OA (офіційний обліковий запис) на платформі обміну повідомленнями Zalo. Помічник підтримує питання та відповіді на різні теми з життя, створення контенту та розваг. Згідно зі статистикою Zalo, помічник Kiki Info мав доступ до облікового запису OA на Zalo менш ніж за 2 місяці до 1 мільйона користувачів.

Модель LLM від Zalo застосована для розробки Kiki Info Assistant (Фото: Zalo).
Ще одним застосуванням моделі LLM від Zalo є листівки зі штучним інтелектом, які також досягли позначки в 15 мільйонів створених та надісланих листівок лише за 2 місяці. Це додаток, який цікавить багатьох користувачів Zalo для надсилання побажань родичам та друзям з нагоди важливих свят.
Наразі Zalo продовжує розширювати та розвивати додатки з моделей великих мов, обіцяючи принести багато корисних значень вітчизняним користувачам.
Джерело: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm






Коментар (0)