VinBigdata mengumumkan kejayaan pembinaan model bahasa Vietnam yang besar pada 21 Ogos, mewujudkan asas untuk menguasai teknologi AI generatif.
Model Bahasa Besar (LLM) ialah model yang dilatih menggunakan teknik pembelajaran mendalam pada set data teks atau imej yang besar. Model ini mampu memahami pengetahuan, menjana teks, dan melaksanakan pelbagai tugas pemprosesan bahasa semula jadi. Mereka dianggap kunci untuk membangunkan teknologi AI Generatif - mampu menjana kandungan dan idea baharu dalam pelbagai bentuk (teks, imej, audio, dll.).
Dengan kejayaan pembinaan model bahasa Vietnam yang besar, VinBigdata akan menyepadukan teknologi untuk menjadikan VinBase (platform kecerdasan buatan berbilang kognitif yang komprehensif) sebagai platform AI generatif di Vietnam, sambil menyediakan penyelesaian pembangunan berdasarkan teknologi ini seperti Generative AI chatbot, callbot atau pembantu maya ViVi generasi baharu... Teknologi ini membantu meningkatkan keaslian komunikasi mesin, sambil menyokong pengguna untuk mencari dan mensintesis maklumat yang lebih mudah sebelum ini.
Profesor Vu Ha Van - Pengarah Saintifik Syarikat VinBigdata. Foto: VinBigdata
Profesor Vu Ha Van - Pengarah Sains Syarikat VinBigdata berkata bahawa di dunia, terdapat beberapa syarikat besar yang telah berjaya menyelidik dan melancarkan produk berdasarkan model bahasa besar seperti OpenAI dengan ChatGPT atau Google dengan Bard. Di Vietnam, VinBigdata dilaburkan oleh Vingroup untuk membina model bahasa Vietnam yang besar. Menurut Encik Van, model ini memberi tumpuan kepada menyelesaikan tiga masalah teras termasuk meningkatkan ketepatan, mengurangkan kos infrastruktur dan memastikan keselamatan.
"Daripada memerlukan kira-kira 175 bilion parameter seperti ChatGPT, VinBigdata boleh mencipta model bahasa yang besar dengan beberapa bilion parameter tetapi masih mempunyai keupayaan untuk menjana dokumen yang sangat tulen, memfokuskan pada data Vietnam dan pengetahuan Vietnam," kata ketua unit itu.
Menguasai teknologi, pembangunan diri dari langkah pertama, membina model bahasa Vietnam yang besar, dianggap sebagai langkah ke hadapan untuk membantu VinBigdata membawa teknologi AI generatif ke dalam ekosistem produk dan perkhidmatan di pasaran. Pada masa ini, perusahaan itu pada mulanya telah menggunakan teknologi baharu pada barisan produk VinBase KB (Portal Pangkalan Pengetahuan VinBase). Produk ini mempunyai keupayaan untuk mendapatkan maklumat dan menjana jawapan secara automatik berdasarkan maklumat yang dikumpul daripada set data yang sangat besar dalam sistem pengetahuan.
Wakil VinBigdata berkongsi pada acara yang mengumumkan Generative AI. Foto: VinBigdata
Dijangkakan pada Disember tahun ini, ahli Vingroup akan melancarkan dua barisan produk utama: VinBase2.0 dan aplikasi ViGPT. VinBase 2.0 ialah platform AI yang mencipta pelbagai persepsi dengan penyelesaian yang melayani perniagaan dan agensi kerajaan . Sementara itu, aplikasi ViGPT diperkenalkan oleh perusahaan sebagai "Versi Vietnam ChatGPT", terbuka untuk akses dan ujian komuniti. Dengan ViGPT, pengguna boleh bertanya dan menjawab soalan tentang maklumat khusus tentang Vietnam (peraturan, dokumen undang-undang) atau maklumat tempatan (sejarah, kesusasteraan, tempat indah, kepakaran tempatan).
Syarikat Saham Bersama VinBigdata mempunyai sistem pangkalan data sehingga 3,500 Terabait. Sistem ini mempunyai ratusan ribu jam data suara, imej dan maklumat yang dibersihkan, diproses, diklasifikasikan dan digunakan untuk latihan AI bersama-sama dengan infrastruktur R&D. Infrastruktur ini termasuk berpuluh-puluh kluster pelayan NvidiaDGX A100. Syarikat itu juga memiliki pasukan profesor, saintis dan pakar teknologi Vietnam dari seluruh dunia.
Hoai Phuong
Pautan sumber
Komen (0)