Шесть лет работы в Zalo позволили Буй Тхи Кук еще больше развить свою страсть к искусственному интеллекту. Начав с должности специалиста по анализу данных сразу после окончания университета, Кук стала старшим инженером по искусственному интеллекту в Zalo, представляя команду разработчиков VMLU и представляя свои исследования на конференции ACL (Ассоциация вычислительной лингвистики) в Вене, Австрия, летом 2025 года.

Эта конференция считается ведущей академической конференцией по обработке естественного языка, ежегодно привлекающей более 2000 исследователей. Многие основополагающие работы по НЛП были представлены здесь еще до того, как стали отраслевыми стандартами.

«С самого первого дня конференции меня поразил масштаб и открытый академический обмен», — вспоминает Кук. Научная атмосфера царила с утра до вечера: было представлено множество постеров, проходили продолжительные технические дискуссии, а также присутствовали лаборатории из Meta, Google, Apple и других компаний.

Из Вьетнама в Вену, Австрия

Исследование Буй Тхи Кук под названием «ACL VMLU Benchmarks: Комплексный набор инструментов для оценки качества вьетнамских языковых моделей» направлено на решение проблемы нехватки инструментов оценки крупномасштабных вьетнамских языковых моделей.

Созданный в ноябре 2023 года компанией Zalo AI и Японским институтом передовых наук и технологий (JAIST), VMLU предоставил общий набор стандартов, призванных помочь разработчикам крупномасштабных языковых моделей (LLM), ориентированных на вьетнамских пользователей, оценивать и разрабатывать соответствующие стратегии обучения для своих моделей.

Г-жа Кук заявила, что в процессе разработки VMLU участники столкнулись с многочисленными трудностями, от создания эталонных показателей до обеспечения качества данных. Однако самым стрессовым этапом был процесс подачи заявок на исследования. Процент принятия заявок на исследования в ACL составляет всего около 25%, и им приходилось конкурировать со многими крупными научно-исследовательскими институтами в области ИИ по всему миру .

«Когда мы получили результаты на конференции Borderline Conference — то есть, выводы были приняты, — вся команда была счастливее, чем ожидалось. После этого я собрал все отзывы от экспертной комиссии, обсудил их со своим непосредственным руководителем и, наконец, убедил рецензентов повысить оценку, чтобы исследовательская работа была принята на основной конференции», — вспоминает Кук.

anh 1 (3).jpg

Это первый бенчмарк, разработанный для оценки способности к пониманию вьетнамского языка у пользователей больших языковых моделей. Бенчмарк включает четыре набора данных, содержащих 17 000 вопросов, для оценки способностей в следующих областях: общие знания, понимание прочитанного, логическое мышление и диалог.

Г-н Нгуен Чыонг Сон, директор по науке в Zalo AI, подтвердил: «Система оценки VMLU предоставляет единый «критерий» для оценки крупномасштабных моделей вьетнамского языка. После ее публикации мы получили много положительных отзывов от сообщества исследователей ИИ как внутри страны, так и за рубежом. В будущем я ожидаю, что VMLU станет широко используемым и применяемым стандартом оценки не только в академическом сообществе, но и в компаниях, разрабатывающих продукты на основе ИИ».

Применение ИИ в продуктах Zalo.

Помимо своей академической ценности, ВМЛУ имеет множество потенциальных применений в разработке продуктов на основе искусственного интеллекта в компании Zalo.

По словам Кука, во-первых, этот тест помогает оценить точность и понимание языка моделями, используемыми в продукте Kiki Info, цифровом помощнике для граждан. Это позволяет команде выявить ограничения модели в конкретных навыках.

Во-вторых, VMLU используется в качестве инструмента тестирования перед внедрением новых функций ИИ, таких как суммирование сообщений, автоматические подсказки для ответов или поддержка клиентов.

В конечном итоге, благодаря своим возможностям оценки разговорных навыков, VMLU помогает Zalo разрабатывать корпоративные чат-боты с естественным звучанием, соответствующим вьетнамской культуре общения.

«Наша главная цель — создать модели искусственного интеллекта, которые понимают вьетнамский язык естественно и точно», — сказал Кук.

фото 2.png

Вернувшись из Вены, молодой инженер надеется, что ВМЛУ продолжит расширяться и станет платформой для многих отечественных исследовательских групп, позволяющей сравнивать и оценивать модели единым образом.

«Я надеюсь, что этот набор данных станет отправной точкой для дальнейшего развития вьетнамского сообщества разработчиков ИИ в ближайшие годы. Мы хотим внести свой небольшой вклад в то, чтобы вьетнамский язык стал языком, который глобальные модели ИИ будут правильно понимать и эффективно обрабатывать».

изображение 3.png
Саммит Zalo AI 2025, посвященный теме «Вьетнам в эпоху ИИ», состоится в субботу, 20 декабря 2025 года, в 8:00 утра на территории кампуса VNG в экспортной зоне Тан Тхуан, Хошимин.
Мероприятие будет транслироваться в прямом эфире на официальных информационных каналах Zalo и, как ожидается, привлечет к участию более 400 инженеров в области искусственного интеллекта.
Зарегистрироваться для участия можно по ссылке: https://summit.zalo.ai/

Бич Дао

Источник: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html