VinBigdata mengumumkan kejayaan pembangunan model bahasa besar Vietnam pada 21 Ogos, sekali gus mewujudkan asas untuk menguasai teknologi generatif AI.
Model Bahasa Besar (LLM) ialah model yang dilatih menggunakan teknik pembelajaran mendalam pada set data teks atau imej yang besar. Model ini mampu memahami pengetahuan, menjana teks secara bebas dan melaksanakan pelbagai tugas pemprosesan bahasa semula jadi. Model ini dianggap penting untuk membangunkan teknologi AI generatif – mampu mencipta kandungan dan idea baharu dalam pelbagai bentuk (teks, imej, audio, dsb.).
Dengan kejayaan pembangunan model bahasa Vietnam berskala besar, VinBigdata akan mengintegrasikan teknologi untuk menjadikan VinBase (platform kecerdasan buatan berbilang kognitif yang komprehensif) sebagai platform penjanaan AI yang terkemuka di Vietnam, di samping menyediakan penyelesaian yang dibangunkan pada teknologi ini seperti chatbot Generatif AI, callbot dan pembantu maya ViVi generasi akan datang... Teknologi ini meningkatkan keaslian komunikasi mesin dan membantu pengguna mencari dan mensintesis maklumat dengan lebih cepat dan mudah berbanding sebelum ini.
Profesor Vu Ha Van - Pengarah Saintifik Syarikat VinBigdata. Foto: VinBigdata
Profesor Vu Ha Van, Pengarah Sains di VinBigdata, menyatakan bahawa beberapa syarikat besar di seluruh dunia telah berjaya menyelidik dan melancarkan produk berdasarkan model bahasa besar, seperti OpenAI dengan ChatGPT dan Google dengan Bard. Di Vietnam, VinBigdata sedang dibangunkan oleh Vingroup untuk membina model bahasa besar Vietnam. Menurut Profesor Van, model ini memberi tumpuan kepada penyelesaian tiga masalah teras: meningkatkan ketepatan, mengurangkan kos infrastruktur dan memastikan keselamatan.
"Daripada memerlukan sekitar 175 bilion parameter seperti ChatGPT, VinBigdata boleh mencipta model bahasa berskala besar dengan beberapa bilion parameter sambil masih dapat menghasilkan teks yang sangat autentik, dengan memberi tumpuan kepada data dan pengetahuan Vietnam," kata ketua unit itu.
Menguasai teknologi, membangun dari awal dan membina model bahasa Vietnam berskala besar dianggap sebagai langkah penting bagi VinBigdata dalam mengintegrasikan teknologi penjanaan AI ke dalam ekosistem produk dan perkhidmatannya di pasaran. Pada masa ini, syarikat itu pada mulanya mengaplikasikan teknologi baharu ini pada rangkaian produk VinBase KB (Portal Pangkalan Pengetahuan VinBase). Produk ini mampu mendapatkan maklumat dan menjana jawapan secara automatik berdasarkan data yang dikumpul daripada set data besar-besaran dalam pangkalan pengetahuannya.
Wakil daripada VinBigdata telah berkongsi maklumat ini di acara pelancaran generasi AI. Foto: VinBigdata
Vingroup dijangka melancarkan dua rangkaian produk utama Disember ini: VinBase 2.0 dan aplikasi ViGPT. VinBase 2.0 ialah platform AI yang menjana respons berbilang kognitif dengan penyelesaian untuk perniagaan dan agensi kerajaan . Sementara itu, aplikasi ViGPT, yang diperkenalkan oleh syarikat sebagai "versi Vietnam ChatGPT," akan dibuka untuk akses dan ujian komuniti. Dengan ViGPT, pengguna boleh bertanya dan menjawab soalan tentang maklumat khusus Vietnam (peraturan, dokumen undang-undang) atau maklumat tempatan (sejarah, kesusasteraan, tempat indah, keistimewaan tempatan).
Syarikat Saham Bersama VinBigdata mempunyai sistem pangkalan data sehingga 3,500 Terabait. Sistem ini mengandungi ratusan ribu jam data suara, imej dan maklumat yang telah dibersihkan, diproses, dikelaskan dan digunakan untuk latihan AI dan infrastruktur R&D. Infrastruktur ini merangkumi berpuluh-puluh kluster pelayan Nvidia DGX A100. Syarikat ini juga mempunyai pasukan profesor, saintis dan pakar teknologi Vietnam dari seluruh dunia.
Hoai Phuong
[iklan_2]
Pautan sumber






Komen (0)