
Согласно отчету Grand View Research, объем мирового рынка крупных языковых моделей, по оценкам, достигнет 5 617 млн долларов США к 2024 году и, как ожидается, будет расти с совокупным годовым темпом роста (CAGR) 36,9% в период с 2025 по 2030 год. Между тем, мир также все больше интересуется ИИ, при этом особое внимание уделяется странам с большим количеством ведущих разработчиков моделей ИИ, таким как США и Китай.
Юго-Восточная Азия получила меньше внимания, но также добилась значительного прогресса. Несмотря на ограниченные ресурсы данных по сравнению с популярными мировыми языками, такими как английский и китайский, компании в регионе начали использовать возможность создания собственных LLM. В частности, Сингапур запустил свою первую модель, SEA-LION LLM, с 13% своего набора данных, обученных на языках Юго-Восточной Азии.
Во Вьетнаме Zalo создала отечественную модель ИИ и впервые запустила ее в 2023 году. Чтобы достичь самодостаточности в технологии ИИ и снизить зависимость от иностранных технологий, Zalo разработала модель с 13 миллиардами параметров с использованием методики обучения с нуля — развернув все процессы от инициализации параметров, выбора архитектуры модели до обучения алгоритмов на определенном наборе данных.
Эта методика обучения помогает вьетнамцам освоить и контролировать весь процесс обучения, а также модель. До сих пор рождение этой модели сделало Вьетнам одной из немногих стран в Юго-Восточной Азии, имеющих отечественную степень магистра права.
![]() |
Не обладая потенциалом крупнейших мировых технологических компаний, ранние этапы разработки большой языковой модели во Вьетнаме столкнулись со многими трудностями. Помимо проблемы нехватки данных, поскольку вьетнамский язык также классифицируется как язык, имеющий в десятки раз более бедные ресурсы данных, чем английский или китайский, вьетнамские инженеры также не полностью оснащены необходимой серверной инфраструктурой.
Между тем, крупные компании мира владеют тысячами новейших графических процессоров от Nvidia. В частности, Вьетнам также имеет ограничения в человеческих ресурсах и опыте обучения моделей LLM по сравнению с развитыми странами мира.
Однако у Zalo все еще есть подходящая стратегия развития, которая поможет преодолеть трудности шаг за шагом. Благодаря вычислительной инфраструктуре, оснащенной 8 серверами DGX H100, модель LLM Zalo была разработана напрямую с использованием новейшей и самой дефицитной на тот момент линейки GPU Nvidia с производительностью до 256 петафлопс (операций с плавающей точкой в секунду — один петафлопс эквивалентен 10 миллионам миллиардов вычислений в секунду).
Zalo также увеличил разработку вьетнамских данных, чтобы компенсировать дефицит рынка, одновременно снабжая вьетнамских инженеров знаниями и возможностями обучения LLM посредством серии исследований, проведенных на небольших гражданских GPU. Это создает основу, готовую к владению более крупной вычислительной инфраструктурой в будущем.
![]() |
Правильная ориентация разработки помогла Zalo успешно разработать большую языковую модель с 7 миллиардами параметров, ориентированную на вьетнамский язык, всего за 6 месяцев обучения в 2023 году, достигнув 150% производительности по сравнению с GPT3.5 OpenAI согласно оценке VMLU — набора эталонных тестов для многозадачного понимания вьетнамского языка для больших языковых моделей (LLM) платформы оценки и ранжирования уровня владения вьетнамским языком.
![]() |
К концу 2024 года большая языковая модель Zalo поднялась на 2-е место в рейтинге моделей VMLU. В частности, модель уступала только Llama-3-70B от Meta, официально превзойдя такие громкие имена, как GPT-4 (OpenAI), gemma-2-9b-it (Google), microsoft/Phi-3-small-128k-instruct (Microsoft).
![]() |
«Несмотря на сложную стартовую позицию по сравнению с другими крупными компаниями мира, Zalo все же решила войти в игру пораньше с целью успешной разработки собственной модели ИИ для Вьетнама. Мы консультировались с исследователями и инженерами из многих ведущих научно-исследовательских институтов мира, чтобы разработать подходящую стратегию развития. Успешные вехи на сегодняшний день являются мотивацией для инженеров Zalo продолжать оптимизировать модель, чтобы она была больше по количеству и лучше по качеству», — сказал доктор Нгуен Труонг Сон, директор по науке в Zalo AI.
![]() |
![]() |
Успешные этапы в исследовании и обучении модели побудили инженеров Zalo применить модель LLM для разработки полезных приложений для вьетнамских пользователей. Типичным примером является помощник Kiki Info Q&A, который работает как OA - официальный аккаунт на Zalo. Помощник предоставляет 3 функции, включая вопросы и ответы по различным темам, таким как наука, история, правила дорожного движения и т. д.; Создание контента, например, написание, составление электронных писем, размещение в социальных сетях и т. д.; и развлечения, предлагая рекомендации по туристическим направлениям, музыке, книгам и т. д.
По статистике Zalo, менее чем за 2 месяца к аккаунтам открытого доступа на Zalo обратились 1 миллион пользователей помощника Kiki Info.
![]() |
Еще одним применением этой большой языковой модели являются открытки на основе искусственного интеллекта, которые пользователи обычно используют для отправки поздравлений родственникам и друзьям по важным случаям. Всего за 2 месяца было создано и отправлено 15 миллионов открыток.
Пользователи высоко ценят эти приложения за их интеллектуальный и удобный интерфейс, помогающий сократить время поиска и принятия решений, а также повышающий качество связи в жизненных отношениях.
![]() |
На пути к новой эре — эре национального роста — партия и правительство полны решимости формировать и продвигать эру технологического развития страны, что отражено в резолюции 57-NQ/TW «О прорыве в науке, технологиях, инновациях и национальной цифровой трансформации».
Стремясь внести свой вклад в развитие технологий страны, Zalo не только стремится освоить передовые технологии в целом и ИИ в частности, но и сопровождает вьетнамское технологическое сообщество, способствуя созданию вьетнамцами продуктов на основе технологий ИИ для служения вьетнамскому народу.
В частности, благодаря стратегии «AI-First» Zalo в настоящее время является новаторской организацией в освоении технологии искусственного интеллекта во Вьетнаме. С 2022 года по настоящее время Zalo разработала ряд практических приложений на основе ИИ, чтобы помочь улучшить пользовательский опыт, таких как Text-to-Voice, Text-to-Speech, Voice-to-Text, Zalo AI Avatar, zSticker AI…
![]() |
Разделяя свою веру в будущее вьетнамских технологий, основатель Zalo Вуонг Куанг Кхай подтвердил: «Прелесть искусственного интеллекта также заключается в его позитивном влиянии на повседневную жизнь людей. Мы здесь, чтобы делиться нашими успехами, стремлениями и вдохновлять на новые пути развития технологий, меняющих жизнь».
Основатель Zalo также подтвердил: «Что касается разработки приложений ИИ, я настроен весьма оптимистично и считаю, что вьетнамцы не уступают никому, не только создавая внутренние приложения, но и экспортируя их по всему миру».
Источник: https://znews.vn/viet-nam-o-dau-giua-cuoc-dua-ai-khoc-liet-tren-toan-cau-post1563045.html
Комментарий (0)