Интерес к ИИ в мире растет, при этом основное внимание уделяется странам со многими из ведущих мировых моделей ИИ, таким как США и Китай. Юго-Восточная Азия — один из важных экономических регионов мира — постепенно становится новой горячей точкой для ИИ, с крупными достижениями, которые могут заинтересовать мировых политиков, инвесторов и экспертов по технологиям.

Во Вьетнаме партия и правительство также полны решимости формировать и продвигать эру технологического развития страны, что продемонстрировано в резолюции 57-NQ/TW о прорыве в развитии науки и техники, инновациях и национальной цифровой трансформации. Такая ориентация создала мощную движущую силу для отечественных технологических предприятий, чтобы инвестировать и использовать потенциал передовых мировых технологий.
В настоящее время Вьетнам стал одной из немногих стран Юго-Восточной Азии, которая владеет внутренней крупной языковой моделью (LLM). В частности, с 2023 года Zalo успешно обучил и запустил модель LLM, ориентированную на вьетнамский язык, исследованную и разработанную полностью командой вьетнамских инженеров.
Выбирайте обучение с нуля и получайте неожиданные результаты
В настоящее время модели ИИ имеют 2 метода обучения, в том числе: метод тонкой настройки модели — метод оптимизации ранее обученных LLM для создания новых LLM для специализированных целей; метод обучения модели с нуля — процесс построения совершенно новой модели, от инициализации параметров, выбора архитектуры модели до алгоритма обучения на определенном наборе данных.
Среди них методы тонкой настройки выбирают многие предприятия из-за их преимуществ, таких как простота внедрения, экономия ресурсов и возможность повышения эффективности. Особенно в контексте Вьетнама, где учебное оборудование и данные ограничены, методы тонкой настройки являются превосходным решением.
Однако Zalo выбрал методику обучения с самого начала. При этом методе весь процесс обучения и модель полностью принадлежат вьетнамцам и контролируются ими. Благодаря этому Вьетнам стал одной из немногих стран Юго-Восточной Азии, которая владеет большой языковой моделью (LLM), разработанной внутри страны.
При запуске в 2023 году первая крупномасштабная языковая модель Zalo с 7 миллиардами параметров, ориентированная на вьетнамский язык, достигла 150% производительности по сравнению с GPT3.5 OpenAI на VMLU Vietnamese LLM Competency Benchmark. Время обучения составило всего 6 месяцев, что намного меньше изначального 18-месячного плана. Такой быстрый процесс обучения удивил всю команду разработчиков Zalo.

Модель LLM от Zalo заняла 3-е место в конкурсе Kahoot при первом запуске в 2023 году (фото: Zalo).
В 2024 году модель Zalo с 13 миллиардами параметров превзошла мировые имена и подтвердила свою позицию среди двух лучших вьетнамских моделей LLM, подготовленных с нуля, согласно рейтингу компетенций LLM во Вьетнаме VMLU.
Результаты показывают, что уровень подготовки больших языковых моделей не уступает мировому уровню разработки собственной модели ИИ во Вьетнаме, особенно в контексте множества трудностей на начальном этапе разработки.
Вьетнамские усилия по разработке моделей ИИ
Представитель Zalo сказал, что для обучения LLM требуется 3 основных элемента: учебное оборудование, данные и технический уровень. Раньше во Вьетнаме по-прежнему было много ограничений по всем 3 аспектам. В частности, в то время как крупные компании мира владели тысячами новейших высокопроизводительных графических процессоров от Nvidia, инженеры во Вьетнаме не были полностью оснащены необходимой серверной инфраструктурой. В то же время вьетнамцы также входят в группу с более слабыми ресурсами данных, чем англичане или китайцы. Человеческие ресурсы и опыт обучения LLM во Вьетнаме также ограничены по сравнению с развитыми странами.
В то время команде Zalo приходилось проводить исследования и эксперименты на небольших гражданских графических процессорах, чтобы получить знания и возможности обучения для LLM, которые были бы готовы, как только станет доступна крупная вычислительная инфраструктура.
Чипы для обучения ИИ дефицитны, поэтому, хотя Zalo заказала 8 серверов Nvidia DGX H100, она не может владеть всеми устройствами сразу и должна ждать поставки каждой партии от производителя. Поэтому оптимизация неполной вычислительной инфраструктуры для экономии времени на обучение также является проблемой, которую должна решить команда Zalo.
В то же время инвестиции также вкладываются в качественные данные по обучению, чтобы компенсировать нехватку вьетнамских источников данных.

«Хотя Zalo и стартовал с трудного положения по сравнению с крупными компаниями мира, он все же решил присоединиться к гонке с целью успешной разработки собственной модели ИИ во Вьетнаме. Мы консультировались с исследователями и инженерами во многих ведущих научно-исследовательских институтах мира, чтобы иметь подходящую стратегию развития.
«Текущие вехи успеха мотивируют инженеров Zalo продолжать оптимизировать модель, чтобы она была больше по количеству и лучше по качеству. В то же время, используя применимость для создания множества продуктов ИИ мирового класса для вьетнамских пользователей», — поделился доктор Нгуен Труонг Сон, директор по науке в Zalo AI.

Сервер DGX H100, который Zalo заказал у Nvidia (Фото: Zalo).
Благодаря гибкой адаптации на сложных ранних этапах разработки Zalo постепенно достигла успешных результатов, продвигаясь к овладению глобальной технологией ИИ в ее нынешнем виде.
В настоящее время модель искусственного интеллекта Зало не только успешна с точки зрения исследований в области обучения, но и применяется на практике, способствуя доступу и использованию преимуществ передовых новых технологий для вьетнамского народа.
Ранее в этом году Zalo запустил помощник Kiki Info Q&A, который работает как OA - Official Account - на платформе обмена сообщениями Zalo. Помощник поддерживает Q&A на различные темы из жизни, создания контента и развлечений. Согласно статистике Zalo, помощник Kiki Info получил 1 миллион пользователей, получивших доступ к учетной записи OA на Zalo менее чем за 2 месяца.

Модель LLM компании Zalo применяется для разработки Kiki Info Assistant (Фото: Zalo).
Другое применение модели LLM Zalo — это AI-карты, которые также достигли отметки в 15 миллионов карт, созданных и отправленных всего за 2 месяца. Это приложение, которым интересуются многие пользователи Zalo, чтобы отправлять пожелания родственникам и друзьям в важные праздники.
В настоящее время Zalo продолжает расширять и развивать приложения на основе больших языковых моделей, обещая принести много полезных ценностей отечественным пользователям.
Источник: https://dantri.com.vn/cong-nghe/zalo-phat-trien-mo-hinh-ai-do-nguoi-viet-lam-chu-20250616161352610.htm
Комментарий (0)