A Zalónál eltöltött hat év lehetővé tette Bui Thi Cuc számára, hogy továbbfejlessze a mesterséges intelligencia iránti szenvedélyét. Az egyetemről frissen kikerült adatkutatói pozícióból Cuc a Zaló vezető mesterséges intelligencia mérnöke lett, a VMLU fejlesztőcsapatát képviselve, és kutatási előadást tartva a 2025 nyarán Bécsben megrendezett ACL (Számítógépes Nyelvészeti Társaság) konferencián.
Ez a természetes nyelvi feldolgozás vezető tudományos konferenciája, amely évente több mint 2000 kutatót vonz. Számos alapvető munkát mutattak be az NLP-ről, mielőtt ipari szabványokká váltak volna.
„Már a konferencia első napjától lenyűgözött a nagyságrend és a nyílt tudományos eszmecsere” – emlékezett vissza Cúc. A kutatási légkör reggeltől estig állandó volt, számos kiállított poszterrel, hosszas technikai megbeszélésekkel, valamint a Meta, a Google, az Apple és más cégek laboratóriumainak jelenlétével.
Vietnámtól Bécsig, Ausztriáig
Bui Thi Cuc kutatása, melynek címe: ACL VMLU Benchmarks: A comprehensive benchmark toolkit for Vietnamese LLMs (ACL VMLU referenciaértékek: Átfogó referenciaérték-eszköztár vietnami nyelvi mesterképzéshez), a nagyszabású vietnami nyelvi modellek értékelési eszközeinek hiányát kívánja orvosolni.
A Zalo AI és a Japán Fejlett Tudományos és Technológiai Intézet (JAIST) által 2023 novemberében elindított VMLU közös szabványkészletet biztosított, amely segíti a vietnami felhasználókat célzó nagyméretű nyelvi modell (LLM) fejlesztőket modelljeik megfelelő betanítási stratégiáinak értékelésében és kidolgozásában.
Cúc asszony kijelentette, hogy a VMLU fejlesztése során a tagok számos kihívással szembesültek, a benchmarkok kidolgozásától az adatminőség biztosításáig. A legstresszesebb szakasz azonban a kutatási anyagok benyújtási folyamata volt. Az ACL-nél a kutatások elfogadási aránya mindössze 25% körül van, és világszerte számos nagy mesterséges intelligencia kutatóintézettel kellett versenyezniük.
„Amikor megkaptuk az eredményeket a Borderline Konferencia szintjén – vagyis az eredményeket elfogadták –, az egész csapat boldogabb volt a vártnál. Ezután összegyűjtöttem az összes visszajelzést a bírálóbizottságtól, megbeszéltem azokat a közvetlen felettesemmel, és végül meggyőztem a bírálókat, hogy emeljék meg a pontszámot, hogy a kutatási dolgozatot elfogadhassák a fő konferencián” – emlékezett vissza Cúc.

Ez az első olyan benchmark, amely a nagy nyelvi modellek vietnami nyelvi megértési képességét méri fel. A benchmark négy adathalmazt tartalmaz, összesen 17 000 kérdéssel, amelyek a következő területeken értékelik a képességeket: általános ismeretek, olvasásértés, érvelés és párbeszéd.
Nguyen Truong Son úr, a Zalo AI tudományos igazgatója megerősítette: „A VMLU értékelési rendszer egy közös »mércét« biztosít a nagyméretű vietnami nyelvi modellek értékeléséhez. A közzététele után sok pozitív visszajelzést kaptunk a mesterséges intelligencia kutatói közösségétől mind belföldön, mind nemzetközi szinten. A jövőben arra számítok, hogy a VMLU széles körben használt és alkalmazott értékelési szabvány lesz, nemcsak az akadémiai közösségben, hanem a mesterséges intelligencia termékeket fejlesztő vállalkozásokban is.”
Mesterséges intelligencia alkalmazása a Zalo termékeiben.
Akadémiai értékén túl a VMLU számos potenciális alkalmazási lehetőséggel rendelkezik a Zalo mesterséges intelligencia alapú termékeinek fejlesztésében.
Cúc szerint a benchmark először is segít felmérni a Kiki Info digitális állampolgári asszisztens termékben használt modellek pontosságát és nyelvi megértését. Ez lehetővé teszi a csapat számára, hogy azonosítsa a modell korlátait bizonyos készségek terén.
Másodszor, a VMLU-t tesztelési eszközként használják új AI-funkciók, például üzenetösszefoglaló, automatikus válaszjavaslatok vagy ügyfélszolgálati támogatás telepítése előtt.
Végső soron a VMLU beszélgetés-értékelési képességeivel segíti a Zalót olyan vállalati chatbotok fejlesztésében, amelyek természetes hangzású kommunikációt biztosítanak, és összhangban vannak a vietnami kommunikációs kultúrával.
„Legnagyobb célunk olyan mesterséges intelligencia modellek létrehozása, amelyek természetes módon és pontosan megértik a vietnamit” – mondta Cúc.

A Bécsből visszatérő fiatal mérnök abban bízik, hogy a VMLU tovább bővül, és számos hazai kutatócsoport számára platformmá válik a modellek egységes összehasonlítására és értékelésére.
„Remélem, hogy ez az adathalmaz kiindulópontként szolgál majd a vietnami MI-közösség számára a további fejlődéshez az elkövetkező években. Szeretnénk egy kis mértékben hozzájárulni ahhoz, hogy a vietnami nyelv olyan nyelv legyen, amelyet a globális MI-modellek helyesen megértenek és hatékonyan feldolgoznak.”

| A „Vietnam a mesterséges intelligencia korában” témájú 2025-ös Zalo AI Summit (Mesterséges Intelligencia Csúcstalálkozó) december 20-án, szombaton, reggel 8:00 órakor kerül megrendezésre a VNG Campuson, a Tan Thuan Exportfeldolgozó Zónában, Ho Si Minh-városban. Az eseményt élőben közvetítik a Zalo hivatalos információs csatornáin, és várhatóan több mint 400 mesterséges intelligencia mérnököt vonz majd. Regisztrálj a részvételhez a következő címen: https://summit.zalo.ai/ |
Bich Dao
Forrás: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html










Hozzászólás (0)