Шість років роботи в Zalo дозволили Буй Тхі Кук глибше розвинути свою пристрасть до штучного інтелекту. З посади спеціаліста з обробки даних, щойно закінчивши університет, Кук стала старшим інженером зі штучного інтелекту в Zalo, представляючи команду розробників VMLU та презентуючи дослідження на конференції ACL (Асоціації обчислювальної лінгвістики) у Відні, Австрія, влітку 2025 року.

Ця конференція вважається провідною академічною конференцією з обробки природної мови, яка щороку залучає понад 2000 дослідників. Багато фундаментальних робіт з НЛП були представлені тут, перш ніж стали галузевими стандартами.

«З самого першого дня конференції мене вразив масштаб та відкритий академічний обмін», – згадував Кук. Дослідницька атмосфера панувала з ранку до вечора: численні постери, тривалі технічні дискусії та присутність лабораторій з Meta, Google, Apple та інших компаній.

З В'єтнаму до Відня, Австрія

Дослідження Буй Тхі Кук під назвою «Контрольні показники ACL VMLU: комплексний набір інструментів для бенчмарків для в'єтнамських LLM» спрямоване на вирішення проблеми браку інструментів оцінювання для масштабних моделей в'єтнамської мови.

Запущений у листопаді 2023 року Zalo AI та Японським інститутом передових наук і технологій (JAIST), VMLU надав спільний набір стандартів, щоб допомогти розробникам великомасштабних мовних моделей (LLM), орієнтованих на в'єтнамських користувачів, оцінити та розробити відповідні стратегії навчання для своїх моделей.

Пані Кук зазначила, що під час розробки VMLU учасники зіткнулися з численними викликами, від створення бенчмарків до забезпечення якості даних. Однак найстресовішим етапом був процес подання досліджень. Рівень прийняття досліджень в ACL становить лише близько 25%, і їм довелося конкурувати з багатьма великими дослідницькими установами штучного інтелекту по всьому світу .

«Коли ми отримали результати на рівні Borderline Conference – тобто висновки були прийняті – вся команда була щасливішою, ніж очікувалося. Після цього я зібрав усі відгуки від рецензентської комісії, обговорив їх зі своїм безпосереднім керівником і нарешті переконав рецензентів підвищити оцінку, щоб дослідницьку роботу було прийнято на головній конференції», – згадував Кук.

анх 1 (3).jpg

Це перший бенчмарк, розроблений для оцінки здатності до розуміння в'єтнамської мови на основі великих мовних моделей. Бенчмарк включає чотири набори даних із 17 000 питань для оцінки здібностей у таких сферах: загальні знання, розуміння прочитаного, міркування та ведення діалогу.

Пан Нгуєн Труонг Сон, директор з науки в Zalo AI, підтвердив: «Система оцінювання VMLU забезпечує загальний «захід» для оцінювання масштабних моделей в'єтнамської мови. Після її публікації ми отримали багато позитивних відгуків від дослідницької спільноти штучного інтелекту як всередині країни, так і за кордоном. У майбутньому я очікую, що VMLU стане широко використовуваним та широко застосовуваним стандартом оцінювання не лише в академічній спільноті, але й у компаніях, що розробляють продукти штучного інтелекту».

Застосування штучного інтелекту до продуктів Zalo.

Окрім академічної цінності, VMLU має багато потенційних застосувань у розробці продуктів штучного інтелекту в Zalo.

За словами Кука, по-перше, бенчмарк допомагає оцінити точність та розуміння мови моделей, що використовуються в продукті Kiki Info, цифровому помічнику громадян. Це дозволяє команді виявити обмеження моделі щодо певних навичок.

По-друге, VMLU використовується як інструмент тестування перед розгортанням нових функцій штучного інтелекту, таких як підсумовування повідомлень, пропозиції автоматичних відповідей або підтримка клієнтів.

Зрештою, завдяки своїм можливостям розмовної оцінки, VMLU допомагає Zalo розробляти корпоративні чат-боти з природним звучанням спілкування, що відповідає в'єтнамській комунікативній культурі.

«Наша найбільша мета — створити моделі штучного інтелекту, які природно та точно розуміють в’єтнамську мову», — сказав Кук.

фото 2.png

Повернувшись з Відня, молодий інженер сподівається, що VMLU продовжить розширюватися та стане платформою для багатьох вітчизняних дослідницьких груп для порівняння та оцінки моделей уніфікованим чином.

«Я сподіваюся, що цей набір даних стане відправною точкою для більш активного розвитку в’єтнамської спільноти штучного інтелекту в найближчі роки. Ми хочемо зробити свій невеликий внесок у те, щоб в’єтнамська мова стала мовою, яку глобальні моделі штучного інтелекту розуміють правильно та ефективно обробляють».

зображення 3.png
Саміт Zalo AI 2025 на тему «В'єтнам в епоху штучного інтелекту» відбудеться о 8:00 ранку в суботу, 20 грудня 2025 року, в кампусі VNG , експортно-переробній зоні Тан Тхуан, Хошимін.
Захід транслюватиметься в прямому ефірі на офіційних інформаційних каналах Zalo та очікується, що в ньому візьмуть участь понад 400 інженерів зі штучного інтелекту.
Зареєструйтесь для участі за посиланням: https://summit.zalo.ai/

Біч Дао

Джерело: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html