Šest let ve společnosti Zalo umožnilo Bui Thi Cuc dále rozvíjet svou vášeň pro umělou inteligenci. Z pozice datové vědkyně po ukončení univerzity se Cuc stala seniorní inženýrkou umělé inteligence ve společnosti Zalo, kde zastupuje vývojový tým VMLU a prezentuje svůj výzkum na konferenci ACL (Asociace pro počítačovou lingvistiku) ve Vídni v Rakousku v létě 2025.

Tato konference je považována za přední akademickou konferenci o zpracování přirozeného jazyka a každoročně přitahuje přes 2 000 výzkumníků. Než se staly průmyslovými standardy, bylo zde prezentováno mnoho základních prací o NLP.

„Hned od prvního dne konference mě ohromil její rozsah a otevřená akademická výměna,“ vzpomínal Cúc. Výzkumná atmosféra byla od rána do večera konstantní, s četnými vystavenými postery, dlouhými technickými diskusemi a přítomností laboratoří od společností Meta, Google, Apple a dalších.

Z Vietnamu do Vídně v Rakousku

Výzkum Bui Thi Cuc s názvem ACL VMLU Benchmarks: Komplexní sada nástrojů pro benchmarking pro vietnamské LLM si klade za cíl řešit nedostatek hodnotících nástrojů pro rozsáhlé vietnamské jazykové modely.

Projekt VMLU, spuštěný v listopadu 2023 společností Zalo AI a Japonským pokročilým institutem pro vědu a technologii (JAIST), poskytl společnou sadu standardů, které pomáhají vývojářům rozsáhlých jazykových modelů (LLM) zaměřených na vietnamské uživatele vyhodnocovat a vyvíjet vhodné školicí strategie pro jejich modely.

Paní Cúc uvedla, že během vývoje VMLU se členové potýkali s řadou výzev, od vytváření benchmarků až po zajištění kvality dat. Nejstresovější fází však byl proces předkládání výzkumných prací. Míra přijetí výzkumných prací na ACL je pouze asi 25 % a museli konkurovat mnoha velkým institucím pro výzkum umělé inteligence po celém světě .

„Když jsme na úrovni konference Borderline obdrželi výsledky – což znamená, že zjištění byla přijata – byl celý tým spokojenější, než se očekávalo. Poté jsem shromáždil veškerou zpětnou vazbu od hodnotící komise, prodiskutoval ji se svým přímým nadřízeným a nakonec jsem přesvědčil recenzenty, aby zvýšili skóre, aby výzkumná práce byla přijata na hlavní konferenci,“ vzpomínal Cúc.

anh 1 (3).jpg

Toto je první benchmark navržený k posouzení schopnosti porozumět vietnamskému jazyku u velkých jazykových modelů. Benchmark zahrnuje čtyři datové sady se 17 000 otázkami k vyhodnocení schopností v: všeobecných znalostech, porozumění čtenému textu, uvažování a dialogu.

Pan Nguyen Truong Son – ředitel vědy ve společnosti Zalo AI, potvrdil: „Hodnoticí systém VMLU poskytuje společné „měřítko“ pro hodnocení rozsáhlých vietnamských jazykových modelů. Po jeho zveřejnění jsme obdrželi mnoho pozitivních ohlasů od výzkumné komunity v oblasti umělé inteligence, a to jak v tuzemsku, tak i v zahraničí. V budoucnu očekávám, že se VMLU stane široce používaným a aplikovaným hodnoticím standardem, a to nejen v akademické komunitě, ale i v podnicích vyvíjejících produkty umělé inteligence.“

Aplikace umělé inteligence na produkty Zalo.

Kromě akademické hodnoty má VMLU mnoho potenciálních aplikací ve vývoji produktů umělé inteligence v Zalo.

Podle Cúca benchmark v první řadě pomáhá vyhodnotit přesnost a jazykovou srozumitelnost modelů používaných v produktu Kiki Info, digitálním občanském asistentovi. To umožňuje týmu identifikovat omezení modelu v konkrétních dovednostech.

Za druhé, VMLU se používá jako testovací nástroj před nasazením nových funkcí umělé inteligence, jako je shrnutí zpráv, automatické návrhy odpovědí nebo podpora zákaznických služeb.

Díky svým schopnostem konverzačního vyhodnocování pomáhá VMLU společnosti Zalo vyvíjet podnikové chatboty s přirozeně znějící komunikací, která je v souladu s vietnamskou komunikační kulturou.

„Naším největším cílem je vytvořit modely umělé inteligence, které vietnamštině rozumí přirozeně a přesně,“ řekl Cúc.

fotografie 2.png

Mladý inženýr doufá, že se VMLU po návratu z Vídně bude dále rozšiřovat a stane se platformou pro mnoho domácích výzkumných skupin, kde budou moci jednotným způsobem porovnávat a vyhodnocovat modely.

„Doufám, že tato datová sada bude výchozím bodem pro silnější rozvoj vietnamské komunity umělé inteligence v nadcházejících letech. Chceme svou malou částí přispět k tomu, aby se vietnamština stala jazykem, kterému globální modely umělé inteligence správně rozumějí a efektivně jej zpracovávají.“

anh 3.png
Summit Zalo AI Summit 2025 s tématem „Vietnam v éře AI-ifikace“ se bude konat v sobotu 20. prosince 2025 v 8:00 v kampusu VNG v exportní zpracovatelské zóně Tan Thuan v Ho Či Minově Městě.
Akce bude vysílána živě na oficiálních informačních kanálech Zalo a očekává se, že se jí zúčastní více než 400 inženýrů umělé inteligence.
Registrace k účasti na: https://summit.zalo.ai/

Bich Dao

Zdroj: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html