Produk itu dengan cepat mencipta heboh dalam komuniti sains dan teknologi Vietnam.
Pilih jalan yang sukar untuk menyelesaikan masalah Vietnam
Pada penghujung tahun 2022, ChatGPT mencipta "big bang", membuka perlumbaan untuk menakluk AI buatan di kalangan negara dan gergasi dalam bidang teknologi. Pada masa itu, komuniti teknologi Vietnam juga bersemangat untuk membangunkan produk Vietnam supaya berdikari dalam teknologi, mengurangkan pergantungan kepada produk antarabangsa. Namun, tidak setiap unit mempunyai kebolehan dan keazaman untuk merealisasikan hasrat tersebut seperti VinBigdata.
"AI Generatif adalah masalah yang sukar. Syarikat besar seperti OpenAI atau Google juga perlu melabur banyak sumber dan masa dalam penyelidikan untuk dapat mencipta produk seperti yang kita lihat. Produk ini sangat bagus, tetapi sebenarnya, saintis masih tidak memahami sepenuhnya mekanisme operasinya. Apabila ia mempunyai ralat, dan apakah ralat yang akan berlaku, hanya sedikit yang dapat meramalkan. Untuk membangunkan produk yang serupa dengan ChatGPT, terdapat lebih sedikit daripada orang Vietnam dalam masa yang singkat, dalam masa satu tahun. memilih untuk "mengambil risiko" kerana jika ChatGPT versi Vietnam tidak dibuat oleh orang Vietnam, maka siapa yang akan melakukannya?" - Profesor Vu Ha Van - Pengarah Sains VinBigdata berkongsi.
Malah, sangat sedikit syarikat memilih untuk membina Model Bahasa Besar mereka sendiri dari awal. Sebagai contoh, GPT 3 OpenAI mempunyai 175 bilion parameter dan dilatih pada set data 45 terabait dan menelan belanja $4.6 juta. Mengikut pengiraan, jumlah wang untuk membangunkan GPT 4 bahkan boleh mencecah $100 juta. "Dengan jumlah yang begitu besar, amat sukar untuk mencari syarikat yang mampu untuk melabur dalam teknologi ini," kata Dr Nguyen Kim Anh - Pengarah Produk VinBigdata.
Untuk membolehkan perniagaan Vietnam mengakses teknologi AI generasi baharu, dengan kos dan infrastruktur yang optimum, VinBigdata memilih arah yang sama sekali berbeza, iaitu mencipta model bahasa dengan hanya 1.6 bilion parameter, tetapi dengan keupayaan yang setara dengan model bahasa besar dengan berbilion parameter. "Hasilnya menunjukkan bahawa dengan seni bina yang dibangunkan oleh VinBigdata sendiri, adalah mungkin untuk mengoptimumkan dan mempercepatkan proses latihan model bahasa, mengurangkan kos infrastruktur (termasuk kos latihan dan kos penggunaan), tetapi masih memastikan kualiti model", tambah Dr Nguyen Kim Anh.
Selepas menyelesaikan masalah saiz model bahasa yang besar, semasa proses "mengandungi" ViGPT, selepas meneliti model asing, pasukan VinBigdata juga menyedari satu lagi cabaran iaitu "ilusi", yang datang dari sifat semula jadi model kebarangkalian statistik.
Sehubungan itu, model bahasa terbesar di dunia sering dilatih dengan sumber data bahasa Inggeris. Oleh itu, model ini tidak benar-benar memahami dan bertindak balas dengan betul terhadap konteks dan budaya orang Vietnam. Ini membawa kepada halusinasi yang menyebabkan model bahasa besar "membuat" jawapan yang salah.
Untuk mencari penyelesaian optimum dalam masa yang singkat, pasukan Pemprosesan Bahasa Semulajadi (NLP) VinBigdata dibahagikan kepada kumpulan kecil, menganalisis dan membincangkan idea yang berbeza untuk mencari arah akhir yang paling sesuai.
“Akhirnya, kami memutuskan untuk membangunkan seni bina yang berbeza daripada kebanyakan model bahasa besar semasa, dan menjalankan latihan pada set data Vietnam yang diperhalusi 600GB, untuk mencipta “pembantu maya pintar” yang boleh memahami dan memberi jawapan mengikut konteks orang Vietnam,” tambah Dr Nguyen Kim Anh.
Aspirasi untuk ekosistem teknologi Vietnam
Menurut keputusan penilaian daripada Piawaian Penilaian Kemahiran Bahasa Vietnam (VMLU), ViGPT mencapai skor purata 42.24%, kedua selepas ChatGPT (48.54%). Keputusan ini membolehkan ViGPT mencari maklumat dengan pantas dan menjawab soalan tentang topik khusus Vietnam.
Sebagai tambahan kepada keupayaan pembantu maya, hasrat pasukan pembangunan adalah untuk mengintegrasikan ViGPT ke dalam produk yang biasa digunakan setiap hari untuk mencipta perubahan dalam kehidupan orang Vietnam. Itulah daya penggerak yang mendorong pasukan VinBigdata untuk membina ekosistem bahasa dan produk suara yang menggunakan ViGPT - ekosistem "Vi" termasuk: ViChat, ViVoice, Pembantu Maya ViVi. Produk ini boleh digunakan dalam banyak industri, daripada industri automotif, perbankan - kewangan, insurans kepada pengangkutan dan banyak lagi bidang lain.
"Apabila bekerja dengan teknologi, terutamanya AI, kami bukan sahaja mahu menakluki sistem yang menarik, kompleks dan sukar dilihat. Kami mahu mencipta produk yang ketara dan sangat terpakai, di mana AI ialah ejen langsung yang mencipta perubahan dalam kehidupan," Pengarah Produk VinBigdata mengesahkan.
Oleh itu, kejayaan pembangunan ViGPT hanyalah langkah pertama dalam perjalanan membawa teknologi dan data "tulen Vietnam" untuk melayani kehidupan berjuta-juta rakyat Vietnam. Seorang wakil VinBigdata berkata bahawa unit ini bertujuan untuk menyepadukan ViGPT ke dalam platform kecerdasan buatan berbilang kognitif VinBase 2.0, untuk menyediakan penyelesaian yang cemerlang untuk organisasi dan perniagaan dalam pelbagai saiz dan industri.
Sebelum ViGPT, pasukan pakar dan jurutera dalam bidang bahasa dan teknologi pemprosesan pertuturan VinBigdata mencipta kejayaannya dengan melancarkan ViVi - pembantu maya Vietnam komprehensif pertama (digunakan dan digunakan pada kereta elektrik VinFast , aplikasi Vinhomes Resident dan platform e-dagang Vinhomes Dalam Talian), pada masa yang sama, seperti menguasai sepenuhnya teknologi dunia atau Voice Biometrik yang paling maju dalam dunia Voicenings.
Kesemua teknologi ini dibangunkan berdasarkan pangkalan data 3,500 terabait, memfokuskan terutamanya pada data khusus Vietnam, dikumpul, dianalisis dan diperhalusi oleh VinBigdata. Matlamat utama adalah untuk membawa teknologi dunia kepada kehidupan Vietnam, menggunakan data dan sistem pengetahuan Vietnam.
| ViGPT ialah "Versi Vietnam ChatGPT" pertama untuk pengguna akhir yang dibina pada model bahasa besar Vietnam (LLM) yang dibangunkan oleh VinBigdata. ViGPT mempunyai ciri yang luar biasa dan direka bentuk untuk memenuhi keperluan orang Vietnam seperti penciptaan kandungan, carian maklumat dan menjawab soalan biasa dengan ciri Vietnam. Daftar dan alami ViGPT di: vigpt.vinbigdata.com |
Thanh Ha
Sumber






Komen (0)