A Zalónál eltöltött hat év lehetővé tette Bui Thi Cuc számára, hogy továbbfejlessze a mesterséges intelligencia iránti szenvedélyét. Az egyetemről frissen kikerült adatkutatói pozícióból Cuc a Zaló vezető mesterséges intelligencia mérnöke lett, a VMLU fejlesztőcsapatát képviselve, és kutatási előadást tartva a 2025 nyarán Bécsben megrendezett ACL (Számítógépes Nyelvészeti Társaság) konferencián.

Ez a természetes nyelvi feldolgozás vezető tudományos konferenciája, amely évente több mint 2000 kutatót vonz. Számos alapvető munkát mutattak be az NLP-ről, mielőtt ipari szabványokká váltak volna.

„Már a konferencia első napjától lenyűgözött a nagyságrend és a nyílt tudományos eszmecsere” – emlékezett vissza Cúc. A kutatási légkör reggeltől estig állandó volt, számos kiállított poszterrel, hosszas technikai megbeszélésekkel, valamint a Meta, a Google, az Apple és más cégek laboratóriumainak jelenlétével.

Vietnámtól Bécsig, Ausztriáig

Bui Thi Cuc kutatása, melynek címe: ACL VMLU Benchmarks: A comprehensive benchmark toolkit for Vietnamese LLMs (ACL VMLU referenciaértékek: Átfogó referenciaérték-eszköztár vietnami nyelvi mesterképzéshez), a nagyszabású vietnami nyelvi modellek értékelési eszközeinek hiányát kívánja orvosolni.

A Zalo AI és a Japán Fejlett Tudományos és Technológiai Intézet (JAIST) által 2023 novemberében elindított VMLU közös szabványkészletet biztosított, amely segíti a vietnami felhasználókat célzó nagyméretű nyelvi modell (LLM) fejlesztőket modelljeik megfelelő betanítási stratégiáinak értékelésében és kidolgozásában.

Cúc asszony kijelentette, hogy a VMLU fejlesztése során a tagok számos kihívással szembesültek, a benchmarkok kidolgozásától az adatminőség biztosításáig. A legstresszesebb szakasz azonban a kutatási anyagok benyújtási folyamata volt. Az ACL-nél a kutatások elfogadási aránya mindössze 25% körül van, és világszerte számos nagy mesterséges intelligencia kutatóintézettel kellett versenyezniük.

„Amikor megkaptuk az eredményeket a Borderline Konferencia szintjén – vagyis az eredményeket elfogadták –, az egész csapat boldogabb volt a vártnál. Ezután összegyűjtöttem az összes visszajelzést a bírálóbizottságtól, megbeszéltem azokat a közvetlen felettesemmel, és végül meggyőztem a bírálókat, hogy emeljék meg a pontszámot, hogy a kutatási dolgozatot elfogadhassák a fő konferencián” – emlékezett vissza Cúc.

anh 1 (3).jpg

Ez az első olyan benchmark, amely a nagy nyelvi modellek vietnami nyelvi megértési képességét méri fel. A benchmark négy adathalmazt tartalmaz, összesen 17 000 kérdéssel, amelyek a következő területeken értékelik a képességeket: általános ismeretek, olvasásértés, érvelés és párbeszéd.

Nguyen Truong Son úr, a Zalo AI tudományos igazgatója megerősítette: „A VMLU értékelési rendszer egy közös »mércét« biztosít a nagyméretű vietnami nyelvi modellek értékeléséhez. A közzététele után sok pozitív visszajelzést kaptunk a mesterséges intelligencia kutatói közösségétől mind belföldön, mind nemzetközi szinten. A jövőben arra számítok, hogy a VMLU széles körben használt és alkalmazott értékelési szabvány lesz, nemcsak az akadémiai közösségben, hanem a mesterséges intelligencia termékeket fejlesztő vállalkozásokban is.”

Mesterséges intelligencia alkalmazása a Zalo termékeiben.

Akadémiai értékén túl a VMLU számos potenciális alkalmazási lehetőséggel rendelkezik a Zalo mesterséges intelligencia alapú termékeinek fejlesztésében.

Cúc szerint a benchmark először is segít felmérni a Kiki Info digitális állampolgári asszisztens termékben használt modellek pontosságát és nyelvi megértését. Ez lehetővé teszi a csapat számára, hogy azonosítsa a modell korlátait bizonyos készségek terén.

Másodszor, a VMLU-t tesztelési eszközként használják új AI-funkciók, például üzenetösszefoglaló, automatikus válaszjavaslatok vagy ügyfélszolgálati támogatás telepítése előtt.

Végső soron a VMLU beszélgetés-értékelési képességeivel segíti a Zalót olyan vállalati chatbotok fejlesztésében, amelyek természetes hangzású kommunikációt biztosítanak, és összhangban vannak a vietnami kommunikációs kultúrával.

„Legnagyobb célunk olyan mesterséges intelligencia modellek létrehozása, amelyek természetes módon és pontosan megértik a vietnamit” – mondta Cúc.

2. fotó.png

A Bécsből visszatérő fiatal mérnök abban bízik, hogy a VMLU tovább bővül, és számos hazai kutatócsoport számára platformmá válik a modellek egységes összehasonlítására és értékelésére.

„Remélem, hogy ez az adathalmaz kiindulópontként szolgál majd a vietnami MI-közösség számára a további fejlődéshez az elkövetkező években. Szeretnénk egy kis mértékben hozzájárulni ahhoz, hogy a vietnami nyelv olyan nyelv legyen, amelyet a globális MI-modellek helyesen megértenek és hatékonyan feldolgoznak.”

anh 3.png
A „Vietnam a mesterséges intelligencia korában” témájú 2025-ös Zalo AI Summit (Mesterséges Intelligencia Csúcstalálkozó) december 20-án, szombaton, reggel 8:00 órakor kerül megrendezésre a VNG Campuson, a Tan Thuan Exportfeldolgozó Zónában, Ho Si Minh-városban.
Az eseményt élőben közvetítik a Zalo hivatalos információs csatornáin, és várhatóan több mint 400 mesterséges intelligencia mérnököt vonz majd.
Regisztrálj a részvételhez a következő címen: https://summit.zalo.ai/

Bich Dao

Forrás: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html