Vietnam.vn - Nền tảng quảng bá Việt Nam

Зало и путь преодоления препятствий ради достижения внутренних устремлений

Пока весь мир наблюдает за стремительным прогрессом сверхдержав в области искусственного интеллекта, команда инженеров-технологов Zalo начинает амбициозный путь: освоить искусственный интеллект на вьетнамском языке.

ZNewsZNews18/06/2025


Зало брат 1

Бурный рост генеративного ИИ полностью изменил глобальный технологический ландшафт.

Зало брат 2

С тех пор, как OpenAI запустила ChatGPT в конце 2022 года, постоянно появляется целый ряд подобных моделей LLM, применяемых во многих областях, таких как здравоохранение, образование , финансы, юриспруденция и т. д. Гонка стала жесткой не только в масштабах предприятия, но и в национальном масштабе с точки зрения возможностей обучения, вычислительной инфраструктуры и данных.

Крупные компании, такие как OpenAI, Google, Meta или Microsoft, обладающие финансовым потенциалом и благоприятными условиями, «быстро» инвестировали миллиарды долларов в приобретение тысяч высокопроизводительных графических процессоров, таких как Nvidia H100 — ключевого фактора для обучения моделей LLM. В этот период стоимость акций Nvidia резко выросла, отражая потребность мира в инфраструктуре.

Зало брат 3


Между тем, технологические компании в развивающихся странах, помимо проблем со стоимостью, сталкиваются с ограничениями на импорт и экспорт оборудования для ИИ-чипов из США. Это приводит к нехватке учебного оборудования и более «медленным» темпам работы по сравнению с технологическими гигантами. Zalo, стремящаяся к развитию на внутреннем рынке, не является исключением.

Zalo anh 4


Что касается данных, предыдущие задачи машинного обучения требовали больших объёмов обучающих данных, но для больших языковых моделей это огромный объём данных. Для создания достаточно хорошей модели системе LLM требуются десятки, а то и сотни миллиардов входных текстовых токенов. Между тем, по популярности вьетнамский язык уступает английскому и китайскому. Это многократно усложнило задачу вьетнамских разработчиков LLM.

Зало брат 5


В 2023 году крупные языковые модели (LLM), такие как GPT-3.5 и GPT-4, произвели фурор в мире технологий, и многие вьетнамские предприятия также выбрали зарубежные доработанные модели, чтобы сократить путь и опередить процесс обучения LLM.

Зало выбрал другой путь — более сложный, но и более самостоятельный: самостоятельное обучение модели с нуля (модель с нуля). Этот путь требует создания всего с нуля — от данных и архитектуры модели до всего процесса обучения. Это решение было принято не для того, чтобы конкурировать с гигантами, а для того, чтобы реализовать стремление самих вьетнамцев: освоить модель магистратуры права (LLM) на родном языке.

Зало брат 6


«Мы предвидели трудности и всё же решили присоединиться к игре пораньше. Мы не конкурировали напрямую с «большими парнями», а выбрали нишевый рынок, где могли добиться большего. Мы стремимся создать модель, которую вьетнамцы будут полностью контролировать — от данных до алгоритмов», — рассказал доктор Нгуен Труонг Сон, главный научный сотрудник Zalo AI.

Несмотря на множество препятствий, связанных с тремя основными факторами, включая инфраструктуру, данные и уровень подготовки, вьетнамские инженеры активно находили решения. Это демонстрирует силу духа и волю вьетнамского народа в сложных условиях, особенно в данном случае, когда они преодолевают трудности в процессе получения степени магистра права для вьетнамских специалистов.

Zalo anh 7

Для подготовки LLM инженерам требовалась соответствующая инфраструктура. Но в то время графические процессоры, такие как Nvidia H100, были практически «мировой редкостью». Крупные компании, в свою очередь, оформляли на них предварительные заказы на год и платили миллионы долларов за их приобретение. Во Вьетнаме Zalo также пытался купить восемь серверов DGX H100, но это оказалось непросто: приходилось ждать каждую партию от производителя.

В отсутствие графических процессоров Nvidia вьетнамским инженерам приходилось гибко использовать гражданские видеокарты для экспериментов с каждой строкой кода и запуска каждой небольшой модели. Вместо того чтобы ждать, инженеры активно готовились, чтобы к моменту появления современного оборудования всё было готово.

Что касается данных, то вместо того, чтобы полагаться на имеющиеся ресурсы, Zalo инвестировал в создание высококачественного хранилища данных специально для вьетнамского языка, чтобы компенсировать серьезный дефицит по сравнению с английским и китайским языками.

Zalo anh 8


Благодаря гибкой стратегии разработки Zalo удалось сократить сроки разработки своей крупной языковой модели с ожидаемых 18 месяцев до 6 месяцев. В конце 2023 года крупная языковая модель Zalo для вьетнамского языка была официально представлена на мероприятии Zalo AI Summit, собравшем ведущее вьетнамское сообщество технологий и искусственного интеллекта. Здесь LLM-модель Zalo дебютировала в конкурсе Kahoot, организованном Tinhte.vn, и неожиданно превзошла GPT 3.5, уступив только GPT4 — LLM-модели, которая на тот момент считалась сильнейшей в мире.

На платформе оценки VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models) модель Zalo в 1,5 раза превысила производительность GPT-3.5 от OpenAI. К концу 2024 года эта модель превзойдёт такие известные имена, как GPT-4 (OpenAI), Gemma-2-9B (Google) или Phi-3-small (Microsoft), уступая по вычислительной мощности Вьетнаму только LLaMA-3-70B от Meta в рейтинге VMLU.

Зало брат 9


Не останавливаясь только на исследованиях, Zalo постепенно воплощает технологии из лабораторных условий в жизнь, коммерциализируя и популяризируя прикладные продукты LLM.

Zalo anh 10


В начале 2025 года сервис вопросов и ответов Kiki Info, работающий в качестве официального аккаунта на платформе Zalo, привлек более 1 миллиона пользователей менее чем за 2 месяца. Другое приложение, Thiep AI, также достигло впечатляющего показателя в 15 миллионов открыток, созданных и отправленных всего за 2 месяца.

Zalo anh 11


История Zalo — это не просто история компании, стремящейся развивать технологии. Это часть более широкой картины: Вьетнам активно продвигает инновации, следуя политике, изложенной в Резолюции 57-NQ/TW, в области науки, развития технологий и национальной цифровой трансформации. Особое внимание уделяется области искусственного интеллекта.

Появление и быстрое развитие вьетнамской программы LLM в Zalo — это не только технологический шаг вперед для бизнеса, но и свидетельство присущего ей потенциала и упорства вьетнамской технологической команды.

Используя метод «с нуля» — обучение моделей с нуля, Zalo выбрал долгий путь, но помог Вьетнаму по-настоящему освоить ИИ. Не только с точки зрения результатов, но и с точки зрения всего процесса: от архитектуры модели, данных, алгоритмов до прикладных продуктов. Успех Zalo также помог Вьетнаму стать одной из немногих стран Юго-Восточной Азии, обладающих собственной моделью магистратуры права (LLM), что является стратегическим достижением в условиях всё более жёсткой глобальной технологической конкуренции.

Zalo anh 12

В предстоящем долгом пути Zalo не остановится на одной модели или нескольких продуктах, а продолжит совершенствовать её как для обслуживания пользователей, так и для создания конкурентоспособной вьетнамской платформы искусственного интеллекта: «Путь развития искусственного интеллекта Zalo ещё долгий. Мы продолжим оптимизировать модель как вширь, так и вглубь, одновременно продвигая её практическое применение. Конечная цель — создавать качественные продукты искусственного интеллекта, которые будут служить на благо вьетнамцев», — добавил г-н Сон.

Успешная разработка Zalo программы обучения на вьетнамском языке LLM — это не только прорыв для бизнеса, но и открытие потенциального будущего для вьетнамского искусственного интеллекта. Упорство и стремление вьетнамского народа привели к достижению достойных результатов. Будущее вьетнамского искусственного интеллекта будет связано не только с Zalo, но и с поколением смелых инженеров, которые будут следовать за ним, наследовать и покорять мир технологий.

Zalo anh 13


Источник: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html


Комментарий (0)

No data
No data
Полюбуйтесь миллионолетним вулканом Чу-Данг-Я в Джиа-Лае.
На реализацию музыкального проекта во славу Отечества группе Vo Ha Tram потребовалось 6 недель.
Кофейня в Ханое ярко украшена красными флагами и желтыми звездами в честь 80-летия Национального дня 2 сентября.
Крылья летят на полигоне А80
Специальные пилоты в парадном строю по случаю Национального дня 2 сентября.
Солдаты маршируют под палящим солнцем на учебном полигоне.
Посмотрите, как вертолеты репетируют в небе над Ханоем в рамках подготовки к Национальному дню 2 сентября.
Сборная Вьетнама U23 блестяще привезла домой трофей чемпионата Юго-Восточной Азии среди команд U23.
Северные острова – как «необработанные драгоценные камни», дешевые морепродукты, 10 минут на лодке от материка.
Мощный строй из пяти истребителей Су-30МК2 готовится к церемонии А80

Наследство

Фигура

Бизнес

No videos available

Новости

Политическая система

Местный

Продукт