Enam tahun bersama Zalo telah membolehkan Bui Thi Cuc mengembangkan lagi minatnya terhadap Kecerdasan Buatan. Daripada jawatan saintis data yang baru tamat pengajian di universiti, Cuc telah menjadi jurutera AI kanan di Zalo, mewakili pasukan pembangunan VMLU dan membentangkan penyelidikan di persidangan ACL (Persatuan Linguistik Pengkomputeran) di Vienna, Austria, pada musim panas tahun 2025.
Ini dianggap sebagai persidangan akademik terkemuka mengenai pemprosesan bahasa semula jadi, yang menarik lebih 2,000 penyelidik setiap tahun. Banyak karya asas mengenai NLP telah dibentangkan di sini sebelum menjadi piawaian industri.
“Dari hari pertama di persidangan itu, saya terharu dengan skala dan pertukaran akademik yang terbuka,” imbas Cúc. Suasana penyelidikan adalah berterusan dari pagi hingga malam, dengan pelbagai poster dipamerkan, perbincangan teknikal yang panjang lebar dan kehadiran makmal dari Meta, Google, Apple dan banyak lagi.
Dari Vietnam ke Vienna, Austria
Kajian Bui Thi Cuc, bertajuk ACL VMLU Benchmarks: A comprehensive benchmark toolkit for Vietnamese LLMs, bertujuan untuk menangani kekurangan alat penilaian untuk model bahasa Vietnam berskala besar.
Dilancarkan pada November 2023 oleh Zalo AI dan Institut Sains dan Teknologi Lanjutan Jepun (JAIST), VMLU telah menyediakan satu set piawaian umum untuk membantu pembangun model bahasa (LLM) berskala besar yang menyasarkan pengguna Vietnam untuk menilai dan membangunkan strategi latihan yang sesuai untuk model mereka.
Cik Cúc menyatakan bahawa semasa pembangunan VMLU, ahli-ahli menghadapi pelbagai cabaran, daripada membina penanda aras hingga memastikan kualiti data. Walau bagaimanapun, fasa yang paling tertekan ialah proses penyerahan penyelidikan. Kadar penerimaan untuk penyelidikan di ACL hanya kira-kira 25%, dan mereka terpaksa bersaing dengan banyak institusi penyelidikan AI yang besar di seluruh dunia .
“Apabila kami menerima keputusan di peringkat Persidangan Borderline – bermakna dapatan kajian telah diterima – seluruh pasukan berasa lebih gembira daripada yang dijangkakan. Selepas itu, saya mengumpulkan semua maklum balas daripada panel semakan, membincangkannya dengan pengurus langsung saya dan akhirnya meyakinkan pengulas untuk menaikkan skor supaya kertas penyelidikan tersebut diterima di persidangan utama,” imbas Cúc.

Ini merupakan penanda aras pertama yang direka untuk menilai keupayaan pemahaman bahasa Vietnam bagi model bahasa yang besar. Penanda aras ini merangkumi empat set data dengan 17,000 soalan untuk menilai kebolehan dalam: pengetahuan umum, pemahaman bacaan, penaakulan dan dialog.
Encik Nguyen Truong Son - Pengarah Sains di Zalo AI, mengesahkan: “Sistem penilaian VMLU menyediakan 'ukuran' yang sama untuk menilai model bahasa Vietnam berskala besar. Selepas penerbitannya, kami menerima banyak maklum balas positif daripada komuniti penyelidikan AI di dalam dan luar negara. Pada masa hadapan, saya menjangkakan VMLU akan menjadi standard penilaian yang digunakan secara meluas dan diaplikasikan secara meluas, bukan sahaja dalam komuniti akademik tetapi juga dalam perniagaan yang membangunkan produk AI.”
Mengaplikasikan AI pada produk Zalo.
Selain nilai akademiknya, VMLU mempunyai banyak aplikasi yang berpotensi dalam pembangunan produk AI di Zalo.
Menurut Cúc, pertama sekali, penanda aras ini membantu menilai ketepatan dan pemahaman bahasa model yang digunakan dalam produk Kiki Info, pembantu warga digital. Ini membolehkan pasukan mengenal pasti batasan model dalam kemahiran tertentu.
Kedua, VMLU digunakan sebagai alat ujian sebelum menggunakan ciri AI baharu, seperti ringkasan mesej, cadangan balasan automatik atau sokongan khidmat pelanggan.
Akhirnya, dengan keupayaan penilaian perbualannya, VMLU membantu Zalo membangunkan bot sembang perusahaan dengan komunikasi yang berbunyi semula jadi yang sejajar dengan budaya komunikasi Vietnam.
"Matlamat terbesar kami adalah untuk mencipta model AI yang memahami bahasa Vietnam secara semula jadi dan tepat," kata Cúc.

Pulang dari Vienna, jurutera muda itu berharap VMLU akan terus berkembang dan menjadi platform untuk banyak kumpulan penyelidikan domestik membandingkan dan menilai model secara bersepadu.
"Saya berharap set data ini akan menjadi titik permulaan bagi komuniti AI Vietnam untuk berkembang dengan lebih kukuh pada tahun-tahun akan datang. Kami ingin menyumbang sebahagian kecil untuk menjadikan bahasa Vietnam sebagai bahasa yang difahami oleh model AI global dengan betul dan diproses dengan berkesan."

| Sidang Kemuncak Zalo AI 2025, bertemakan “Vietnam dalam Era AI-ifikasi,” akan diadakan pada jam 8:00 pagi, Sabtu, 20 Disember 2025, di Kampus VNG , Zon Pemprosesan Eksport Tan Thuan, Bandar Raya Ho Chi Minh. Acara ini akan disiarkan secara langsung di saluran maklumat rasmi Zalo dan dijangka menarik lebih daripada 400 jurutera AI. Daftar untuk menyertai di: https://summit.zalo.ai/ |
Bich Dao
Sumber: https://vietnamnet.vn/nu-ky-su-zalo-dua-cong-nghe-viet-toi-hoi-thao-ai-hang-dau-the-gioi-2471254.html










Komen (0)