Ledakan AI Generatif telah sepenuhnya mengubah lanskap teknologi global.
Sejak OpenAI meluncurkan ChatGPT pada akhir tahun 2022, serangkaian model LLM serupa terus bermunculan, diterapkan di berbagai bidang seperti kesehatan, pendidikan , keuangan, hukum, dan sebagainya. Persaingan semakin sengit, tidak hanya di skala perusahaan, tetapi juga di skala nasional dalam hal kapasitas pelatihan, infrastruktur komputasi, dan data.
Perusahaan-perusahaan besar seperti OpenAI, Google, Meta, atau Microsoft dengan potensi finansial dan kondisi yang menguntungkan, semuanya "dengan cepat" menginvestasikan miliaran dolar untuk memiliki ribuan GPU kelas atas seperti Nvidia H100—faktor inti untuk melatih model LLM. Harga saham Nvidia meroket selama periode tersebut, mencerminkan kebutuhan dunia akan infrastruktur.
Sementara itu, perusahaan teknologi di negara berkembang, selain masalah biaya, juga menghadapi pembatasan impor dan ekspor peralatan chip AI dari AS. Hal ini menyebabkan kurangnya peralatan pelatihan dan menjadi "lebih lambat" dibandingkan dengan raksasa teknologi. Dengan aspirasi domestik, Zalo tidak terkecuali.
Dari segi data, permasalahan pembelajaran mesin sebelumnya membutuhkan data pelatihan dalam jumlah besar, tetapi untuk model bahasa yang besar, jumlah data ini sangat besar. Untuk menghasilkan model yang memadai, sistem LLM membutuhkan puluhan atau bahkan ratusan miliar token teks masukan. Sementara itu, dari segi popularitas, bahasa Vietnam belum setara dengan bahasa Inggris dan Mandarin. Hal ini mempersulit para pengembang LLM bahasa Vietnam.
Pada tahun 2023, model bahasa besar (LLM) seperti GPT-3.5, GPT-4 telah menggemparkan dunia teknologi, dan banyak perusahaan Vietnam juga telah memilih model buatan luar negeri yang disempurnakan untuk mengambil jalan pintas dan menjadi yang terdepan dalam proses pelatihan LLM.
Zalo memilih jalur yang berbeda—lebih sulit, tetapi lebih otonom: Melatih model secara mandiri dari awal (from-scratch model). Jalur yang mengharuskan semuanya dibangun dari awal—mulai dari data, arsitektur model, hingga keseluruhan proses pelatihan. Keputusan itu bukan untuk bersaing dengan para raksasa, melainkan untuk mewujudkan aspirasi masyarakat Vietnam sendiri: menguasai model LLM dalam bahasa ibu mereka.
"Kami mengantisipasi kesulitannya dan tetap memutuskan untuk bergabung lebih awal. Kami tidak bersaing langsung dengan "pemain besar" tetapi memilih ceruk pasar yang dapat kami tingkatkan. Aspirasi kami adalah membangun model yang sepenuhnya dikendalikan oleh orang Vietnam - mulai dari data hingga algoritma," ujar Dr. Nguyen Truong Son, Chief Science Officer di Zalo AI.
Meskipun menghadapi banyak kendala dalam tiga faktor utama, yaitu infrastruktur, data, dan tingkat pelatihan, para insinyur Vietnam telah secara proaktif menemukan solusi untuk mengatasi kesulitan tersebut. Hal ini menunjukkan semangat dan tekad masyarakat Vietnam dalam menghadapi situasi sulit, khususnya dalam hal ini, menaklukkan tantangan dalam proses pengembangan LLM bagi masyarakat Vietnam.
Untuk melatih LLM, para insinyur membutuhkan infrastruktur yang tepat. Namun, pada saat itu, GPU seperti H100 milik Nvidia hampir merupakan "barang langka di dunia". Sementara itu, perusahaan-perusahaan besar telah memesannya selama setahun dan membayar jutaan dolar untuk memilikinya. Di Vietnam, Zalo juga mencoba membeli 8 server DGX H100, tetapi itu tidak mudah, karena harus menunggu setiap batch pengiriman dari produsen.
Karena ketiadaan GPU Nvidia, para insinyur Vietnam harus secara fleksibel menggunakan GPU sipil untuk bereksperimen pada setiap baris kode dan menjalankan setiap model kecil. Alih-alih menunggu, para insinyur secara proaktif mempersiapkan diri sehingga ketika mereka memiliki peralatan modern, semuanya sudah siap.
Dalam hal data, alih-alih mengandalkan sumber daya yang tersedia, Zalo berinvestasi dalam membangun gudang data berkualitas tinggi khusus untuk bahasa Vietnam, untuk mengatasi kekurangan serius dibandingkan dengan bahasa Inggris dan Mandarin.
Berkat strategi pengembangannya yang fleksibel, Zalo berhasil mempersingkat waktu pengembangan model bahasa besarnya dari yang diperkirakan 18 bulan menjadi 6 bulan. Pada akhir tahun 2023, model bahasa besar Zalo untuk Vietnam resmi diluncurkan di acara yang mempertemukan komunitas teknologi dan AI terkemuka di Vietnam - Zalo AI Summit. Di acara ini, model LLM Zalo memulai debutnya melalui tantangan Kahoot yang diselenggarakan oleh Tinhte.vn dan secara mengejutkan melampaui GPT 3.5, hanya di belakang GPT4 - model LLM yang dianggap terkuat di dunia saat itu.
Pada platform evaluasi VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), model Zalo mencapai 1,5 kali lipat kapasitas GPT-3.5 milik OpenAI. Pada akhir tahun 2024, model ini akan melampaui nama-nama besar seperti GPT-4 (OpenAI), Gemma-2-9B (Google), atau Phi-3-small (Microsoft), hanya di belakang LLaMA-3-70B milik Meta dalam hal kapasitas pemrosesan bahasa Vietnam pada peringkat VMLU.
Tidak hanya berhenti pada penelitian, Zalo secara bertahap menghidupkan teknologi dari laboratorium dengan mengomersialkan dan mempopulerkan produk aplikasi dari LLM.
Pada awal 2025, asisten tanya jawab Kiki Info—yang beroperasi sebagai akun resmi di platform Zalo—menarik lebih dari 1 juta pengguna dalam waktu kurang dari 2 bulan. Aplikasi lain, Thiep AI, juga mencapai angka impresif, yaitu 15 juta kartu dibuat dan dikirim hanya dalam 2 bulan.
Perjalanan Zalo bukan hanya tentang sebuah perusahaan yang ingin mengembangkan teknologi. Ini adalah bagian dari gambaran yang lebih besar - di mana Vietnam secara agresif mempromosikan inovasi, dengan kebijakan dari Resolusi 57-NQ/TW tentang sains, pengembangan teknologi, dan transformasi digital nasional. Khususnya, bidang kecerdasan buatan menjadi fokus utama.
Kemunculan dan perkembangan pesat LLM Vietnam dari Zalo tidak hanya merupakan langkah maju teknologi bagi sebuah bisnis, tetapi juga bukti kapasitas dan ketekunan yang dimiliki tim teknologi Vietnam.
Dengan teknik "dari awal"—melatih model dari nol—Zalo memilih jalan panjang, tetapi membantu Vietnam benar-benar menguasai AI. Tidak hanya dari segi hasil, tetapi juga dari keseluruhan proses, mulai dari arsitektur model, data, algoritma, hingga produk aplikasi. Kesuksesan Zalo juga telah membantu Vietnam menjadi salah satu dari sedikit negara di Asia Tenggara yang memiliki model LLM domestik—sebuah tonggak strategis dalam konteks persaingan teknologi global yang semakin ketat.
Dalam perjalanan panjang ke depannya, Zalo tidak hanya akan berhenti pada satu model atau beberapa produk, tetapi akan terus menyempurnakan model tersebut untuk melayani pengguna sekaligus menciptakan platform AI Vietnam yang kompetitif: “Perjalanan pengembangan AI Zalo masih panjang. Kami akan terus mengoptimalkan model ini, baik secara menyeluruh maupun mendalam, sambil mendorong penerapan praktis. Tujuan utamanya adalah menciptakan produk AI berkualitas yang secara praktis melayani masyarakat Vietnam,” tambah Bapak Son.
Keberhasilan Zalo dalam mengembangkan LLM Vietnam bukan hanya sebuah terobosan bagi bisnis, tetapi juga membuka potensi masa depan bagi kecerdasan buatan Vietnam. Kegigihan dan aspirasi rakyat Vietnam telah membawa perjalanan ini menuju hasil yang berharga. Masa depan AI Vietnam tidak hanya akan memiliki "Zalo", tetapi juga generasi insinyur pemberani yang akan mengikuti, mewarisi, dan menaklukkan dunia teknologi.
Sumber: https://znews.vn/zalo-va-hanh-trinh-lam-chu-llm-tieng-viet-post1561765.html
Komentar (0)