VinBigdata mengumumkan keberhasilan pengembangan model bahasa besar Vietnam pada tanggal 21 Agustus, menciptakan fondasi untuk menguasai teknologi generatif AI.
Model Bahasa Besar (Large Language Models/LLM) adalah model yang dilatih menggunakan teknik pembelajaran mendalam pada kumpulan data teks atau gambar yang sangat besar. Model-model ini mampu memahami pengetahuan, menghasilkan teks secara mandiri, dan melakukan berbagai tugas pemrosesan bahasa alami. LLM dianggap sebagai kunci untuk mengembangkan teknologi AI generatif – yang mampu menciptakan konten dan ide baru dalam berbagai bentuk (teks, gambar, audio, dll.).
Dengan keberhasilan pengembangan model bahasa Vietnam skala besar, VinBigdata akan mengintegrasikan teknologi untuk menjadikan VinBase (platform kecerdasan buatan multi-kognitif komprehensif) sebagai platform generasi AI terkemuka di Vietnam, sekaligus menyediakan solusi yang dikembangkan berdasarkan teknologi ini seperti chatbot AI generatif, callbot, dan asisten virtual ViVi generasi berikutnya... Teknologi ini meningkatkan naturalitas komunikasi mesin dan membantu pengguna mencari dan mensintesis informasi lebih cepat dan mudah daripada sebelumnya.
Profesor Vu Ha Van - Direktur Ilmiah Perusahaan VinBigdata. Foto: VinBigdata
Profesor Vu Ha Van, Direktur Sains di VinBigdata, menyatakan bahwa beberapa perusahaan besar di seluruh dunia telah berhasil meneliti dan meluncurkan produk berdasarkan model bahasa besar, seperti OpenAI dengan ChatGPT dan Google dengan Bard. Di Vietnam, VinBigdata sedang dikembangkan oleh Vingroup untuk membangun model bahasa besar Vietnam. Menurut Profesor Van, model ini berfokus pada penyelesaian tiga masalah inti: meningkatkan akurasi, mengurangi biaya infrastruktur, dan memastikan keamanan.
"Alih-alih membutuhkan sekitar 175 miliar parameter seperti ChatGPT, VinBigdata dapat membuat model bahasa skala besar dengan beberapa miliar parameter sambil tetap mampu menghasilkan teks yang sangat autentik, dengan fokus pada data dan pengetahuan Vietnam," kata pemimpin unit tersebut.
Menguasai teknologi, mengembangkan dari awal, dan membangun model bahasa Vietnam berskala besar dianggap sebagai langkah penting bagi VinBigdata dalam mengintegrasikan teknologi generasi AI ke dalam ekosistem produk dan layanannya di pasar. Saat ini, perusahaan tersebut awalnya menerapkan teknologi baru ini pada lini produk VinBase KB (Portal Basis Pengetahuan VinBase). Produk ini mampu mengambil informasi dan secara otomatis menghasilkan jawaban berdasarkan data yang dikumpulkan dari kumpulan data besar di dalam basis pengetahuannya.
Perwakilan dari VinBigdata membagikan informasi ini pada acara peluncuran generasi AI. Foto: VinBigdata
Vingroup diperkirakan akan meluncurkan dua lini produk utama pada bulan Desember ini: VinBase 2.0 dan aplikasi ViGPT. VinBase 2.0 adalah platform AI yang menghasilkan respons multi-kognitif dengan solusi untuk bisnis dan instansi pemerintah . Sementara itu, aplikasi ViGPT, yang diperkenalkan oleh perusahaan sebagai "versi Vietnam dari ChatGPT," akan dibuka untuk akses dan pengujian komunitas. Dengan ViGPT, pengguna dapat bertanya dan menjawab pertanyaan tentang informasi spesifik Vietnam (peraturan, dokumen hukum) atau informasi lokal (sejarah, sastra, tempat wisata, makanan khas lokal).
VinBigdata Joint Stock Company memiliki sistem basis data hingga 3.500 Terabyte. Sistem ini berisi ratusan ribu jam data suara, gambar, dan informasi yang telah dibersihkan, diproses, diklasifikasikan, dan digunakan untuk pelatihan AI dan infrastruktur R&D. Infrastruktur ini mencakup puluhan klaster server Nvidia DGX A100. Perusahaan ini juga memiliki tim yang terdiri dari profesor, ilmuwan, dan pakar teknologi Vietnam dari seluruh dunia.
Hoai Phuong
Tautan sumber






Komentar (0)