Six années passées chez Zalo ont permis à Bui Thi Cuc d'approfondir sa passion pour l'intelligence artificielle. Après avoir débuté comme data scientist à la sortie de l'université, elle est devenue ingénieure en IA senior chez Zalo, représentant l'équipe de développement VMLU et présentant ses recherches à la conférence de l'ACL (Association for Computational Linguistics) à Vienne, en Autriche, durant l'été 2025.

Considérée comme la principale conférence académique sur le traitement automatique du langage naturel, elle attire chaque année plus de 2 000 chercheurs. De nombreux travaux fondamentaux en TALN y ont été présentés avant de devenir des standards industriels.

« Dès le premier jour de la conférence, j'ai été impressionné par son ampleur et la richesse des échanges académiques », se souvient Cúc. L'atmosphère était imprégnée de recherche du matin au soir, avec de nombreux posters exposés, de longues discussions techniques et la présence de laboratoires de Meta, Google, Apple et bien d'autres.

Du Vietnam à Vienne, en Autriche

Les recherches de Bui Thi Cuc, intitulées ACL VMLU Benchmarks : une boîte à outils de référence complète pour les LLM vietnamiens, visent à remédier au manque d'outils d'évaluation pour les modèles de langue vietnamiens à grande échelle.

Lancée en novembre 2023 par Zalo AI et le Japan Advanced Institute of Science and Technology (JAIST), VMLU a fourni un ensemble commun de normes pour aider les développeurs de modèles de langage à grande échelle (LLM) destinés aux utilisateurs vietnamiens à évaluer et à développer des stratégies d'entraînement appropriées pour leurs modèles.

Mme Cúc a indiqué que, lors du développement de VMLU, les membres ont dû relever de nombreux défis, de l'établissement de critères de référence à la garantie de la qualité des données. Cependant, la phase la plus stressante a été le processus de soumission des recherches. Le taux d'acceptation des recherches à l'ACL n'étant que d'environ 25 %, ils ont dû faire face à la concurrence de nombreux grands instituts de recherche en IA du monde entier .

« Lorsque nous avons reçu les résultats de la conférence préliminaire – c’est-à-dire que les conclusions ont été acceptées – toute l’équipe était ravie. J’ai ensuite rassemblé tous les commentaires du comité d’évaluation, j’en ai discuté avec mon supérieur hiérarchique et j’ai finalement convaincu les évaluateurs de revoir leur note à la hausse afin que l’article soit accepté à la conférence principale », se souvient Cúc.

anh 1 (3).jpg

Il s'agit du premier banc d'essai conçu pour évaluer la capacité de compréhension du vietnamien des grands modèles de langage. Ce banc d'essai comprend quatre ensembles de données contenant 17 000 questions afin d'évaluer les compétences en : culture générale, compréhension écrite, raisonnement et dialogue.

M. Nguyen Truong Son, directeur scientifique de Zalo AI, a déclaré : « Le système d’évaluation VMLU offre une mesure commune pour l’évaluation des modèles de langue vietnamienne à grande échelle. Suite à sa publication, nous avons reçu de nombreux retours positifs de la part de la communauté de recherche en IA, tant au niveau national qu’international. À l’avenir, je m’attends à ce que VMLU devienne une norme d’évaluation largement utilisée et appliquée, non seulement dans le milieu universitaire, mais aussi par les entreprises développant des produits d’IA. »

Application de l'IA aux produits Zalo.

Au-delà de sa valeur académique, VMLU présente de nombreuses applications potentielles dans le développement de produits d'IA chez Zalo.

Selon Cúc, ce test de performance permet tout d'abord d'évaluer la précision et la compréhension linguistique des modèles utilisés dans Kiki Info, un assistant numérique citoyen. Cela permet à l'équipe d'identifier les limites du modèle dans certaines compétences.

Deuxièmement, VMLU est utilisé comme outil de test avant le déploiement de nouvelles fonctionnalités d'IA, telles que la synthèse de messages, les suggestions de réponses automatiques ou l'assistance au service client.

En définitive, grâce à ses capacités d'évaluation conversationnelle, VMLU aide Zalo à développer des chatbots d'entreprise dotés d'une communication naturelle, en phase avec la culture de communication vietnamienne.

« Notre objectif principal est de créer des modèles d'IA qui comprennent le vietnamien de manière naturelle et précise », a déclaré Cúc.

photo 2.png

De retour de Vienne, le jeune ingénieur espère que VMLU continuera de se développer et deviendra une plateforme permettant à de nombreux groupes de recherche nationaux de comparer et d'évaluer des modèles de manière unifiée.

« J’espère que cet ensemble de données servira de point de départ au développement de la communauté vietnamienne de l’IA dans les années à venir. Nous souhaitons contribuer, même modestement, à faire du vietnamien une langue que les modèles d’IA mondiaux comprennent et traitent correctement. »

image 3.png
Le Zalo AI Summit 2025, sur le thème « Le Vietnam à l'ère de l'IA », se tiendra à 8h00 le samedi 20 décembre 2025 sur le campus VNG , dans la zone franche d'exportation de Tan Thuan, à Hô Chi Minh-Ville.
L'événement sera diffusé en direct sur les canaux d'information officiels de Zalo et devrait attirer plus de 400 ingénieurs en intelligence artificielle.
Inscrivez-vous pour participer à l'adresse suivante : https://summit.zalo.ai/

Bich Dao

Source : https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html