Глобальный интерес к ИИ растет, при этом основное внимание уделяется странам с ведущими моделями ИИ, таким как США и Китай. Будучи одним из важных экономических регионов мира, Юго-Восточная Азия постепенно становится новой горячей точкой для ИИ, с крупными достижениями, которые могут привлечь внимание мировых политиков, инвесторов и экспертов по технологиям.
![]() |
У Вьетнама уже есть собственная модель ИИ, одна из немногих моделей ИИ, разработанных с нуля в Юго-Восточной Азии на сегодняшний день. Фото: Zalo. |
Во Вьетнаме партия и правительство также полны решимости формировать и продвигать эру технологического развития страны, что продемонстрировано в резолюции 57-NQ/TW о прорыве в науке , технологиях, инновациях и национальной цифровой трансформации. Такая ориентация создала мощную движущую силу для отечественных технологических предприятий, чтобы инвестировать и использовать потенциал передовых мировых технологий.
В настоящее время Вьетнам стал одной из немногих стран Юго-Восточной Азии, которая владеет внутренней крупной языковой моделью (LLM). В частности, с 2023 года Zalo успешно обучил и запустил модель LLM, ориентированную на вьетнамский язык, исследованную и разработанную полностью командой вьетнамских инженеров.
Выбирайте обучение с нуля и получайте неожиданные результаты
В современных моделях ИИ используются два метода обучения, включая тонкую настройку модели — оптимизацию ранее обученных LLM для создания новых LLM для определенной цели и модель с нуля — реализацию всех процессов от инициализации параметров и принятия решений об архитектуре модели до алгоритмов обучения на заданном наборе данных.
Среди них тонкая настройка выбирается многими предприятиями из-за ее преимуществ, таких как простота внедрения, экономия ресурсов и возможность повышения эффективности. Особенно в контексте, где учебное оборудование и данные являются почти непреодолимыми проблемами во Вьетнаме, методы тонкой настройки считаются превосходным решением.
Однако Zalo выбрал методику обучения с самого начала. С этой методикой обучения весь процесс обучения и модель полностью принадлежат и контролируются вьетнамцами, помогая Вьетнаму стать одной из немногих стран в Юго-Восточной Азии с отечественной LLM.
При запуске в 2023 году первая крупномасштабная языковая модель Zalo, ориентированная на вьетнамский язык, с 7 миллиардами параметров достигла 150% производительности по сравнению с GPT3.5 OpenAI на VMLU Vietnamese LLM Competency Benchmark. Примечательно, что время обучения составило всего 6 месяцев, что намного меньше первоначальной оценки в 18 месяцев. Такой быстрый процесс обучения удивил всю команду разработчиков Zalo.
Модель LLM от Zalo заняла 3-е место в конкурсе Kahoot, уступив реальному игроку и GPT 4 в своем дебюте в 2023 году. Фото: Zalo. |
В 2024 году модель Zalo с 13 миллиардами параметров официально превзошла такие громкие имена, как GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft), уступив только Llama-3-70B (Meta) в рейтинге вьетнамских LLM-программ VMLU.
![]() |
Рейтинг VMLU: 10 лучших моделей, созданных с нуля в 2024 году. Фото: Zalo. |
Результаты показывают, что уровень подготовки больших языковых моделей не уступает мировому уровню разработки собственной модели ИИ во Вьетнаме, особенно в контексте множества трудностей на начальном этапе разработки.
Вьетнамские усилия по разработке моделей ИИ
При обучении LLM есть три основных вопроса: учебное оборудование, данные и технический уровень, но Вьетнам столкнулся с препятствиями по всем трем пунктам. Раньше, в то время как крупные компании мира владели тысячами новейших высокопроизводительных графических процессоров от Nvidia, во Вьетнаме инженеры не были полностью оснащены необходимой серверной инфраструктурой. В то же время вьетнамцы также входят в группу с ресурсами данных в десятки раз беднее, чем англичане или китайцы. Человеческие ресурсы и опыт обучения LLM во Вьетнаме также ограничены по сравнению с развитыми странами.
Команда Zalo в то время должна была исследовать и экспериментировать на небольших гражданских графических процессорах, чтобы вооружиться знаниями и возможностями обучения LLM, готовыми, как только станет доступна крупная вычислительная инфраструктура. Чипы для обучения ИИ были в дефиците, поэтому, хотя Zalo заказала 8 серверов Nvidia DGX H100, она не могла владеть всеми устройствами сразу и должна была ждать поставки каждой партии от производителя. Поэтому оптимизация неполной вычислительной инфраструктуры для экономии времени на обучение также была проблемой, которую должна была решить команда Zalo.
В то же время инвестиции также вкладываются в качественные данные по обучению, чтобы компенсировать нехватку вьетнамских источников данных.
![]() |
Доктор Нгуен Труонг Сон, директор по науке Zalo AI. Фото: Зало. |
«Несмотря на сложную стартовую позицию по сравнению с другими крупными компаниями мира, Zalo все же решила войти в игру пораньше с целью успешной разработки собственной модели ИИ для Вьетнама. Мы консультировались с исследователями и инженерами многих ведущих научно-исследовательских институтов мира, чтобы разработать подходящую стратегию развития. Успешные вехи на сегодняшний день являются мотивацией для инженеров Zalo продолжать оптимизировать модель, чтобы она была больше по количеству и лучше по качеству. В то же время, используя применимость для создания множества продуктов ИИ мирового класса для вьетнамских пользователей», — сказал доктор Нгуен Труонг Сон, директор по науке в Zalo AI.
![]() |
Сервер DGX H100 Zalo заказал у Nvidia. Фото: Zalo. |
Благодаря гибкой адаптации на сложных ранних этапах разработки Zalo постепенно достигла успешных результатов, продвигаясь к овладению глобальной технологией ИИ в ее нынешнем виде.
В настоящее время модель искусственного интеллекта Зало не только успешна с точки зрения исследований в области обучения, но и применяется на практике, способствуя доступу и использованию преимуществ передовых новых технологий для вьетнамского народа.
В начале 2025 года Zalo запустил помощник Kiki Info Q&A, который работает как OA - официальный аккаунт на платформе обмена сообщениями Zalo. Помощник поддерживает вопросы и ответы на различные темы из жизни, создания контента и развлечений. Согласно статистике Zalo, помощник Kiki Info получил 1 миллион пользователей, получивших доступ к аккаунту OA на Zalo менее чем за 2 месяца.
![]() |
Модель LLM Zalo применяется для разработки Kiki Info Assistant. Фото: Zalo. |
Другое применение модели LLM Zalo — это AI-карты, которые также достигли отметки в 15 миллионов карт, созданных и отправленных всего за 2 месяца. Это приложение, которым интересуются многие пользователи Zalo, чтобы отправлять пожелания родственникам и друзьям в важные праздники.
В настоящее время Zalo продолжает расширять и развивать приложения из больших языковых моделей, обещая принести много полезных ценностей отечественным пользователям.
Источник: https://znews.vn/viet-nam-da-co-mo-hinh-ai-do-nguoi-viet-lam-chu-post1560653.html
Комментарий (0)