Pada acara Hari Kecerdasan Buatan 2023 dengan tema "AI - membina semula realiti" yang berlangsung pada 5 dan 6 Disember, Syarikat Penyelidikan dan Aplikasi Kepintaran Buatan VinAI ( Vingroup Corporation) mengumumkan projek penyelidikan sumber terbuka mengenai model bahasa besar untuk bahasa Vietnam, PhoGPT.
PhoGPT ialah projek sumber terbuka dan bukannya perisian proprietari seperti ChatGPT OpenAI. Kerana ia adalah sumber terbuka, tiada had komersial, semua pihak boleh menggunakan PhoGPT untuk membangunkan aplikasi mereka sendiri, termasuk unit aplikasi untuk tujuan komersial. Iaitu, ini seperti platform menyediakan komuniti membangunkan aplikasi berkaitan teknologi AI di negara ini.
Menurut Dr. Bui Hai Hung, Pengarah Besar Syarikat Penyelidikan dan Aplikasi Kecerdasan Buatan VinAI, batasan model bahasa Vietnam telah membuktikan bahawa model ini tidak mencapai prestasi optimum dan kekurangan set kod sumber terbuka. Oleh itu, salah satu tugas mendesak yang dihadapi oleh komuniti AI secara amnya, dan komuniti pemprosesan bahasa semula jadi (NLP) khususnya, adalah untuk membina model baharu yang lebih berkuasa yang mampu memproses bahasa Vietnam dengan ketepatan dan prestasi yang tinggi.
Pakar AI mengatakan bahawa dengan model bahasa data besar dengan 7.5 bilion parameter, dibina pada platform penyahkodan Transformer, model ini dilatih dari awal, menggunakan teknik paling canggih yang tersedia seperti mekanisme Flash Attention, ekstrapolasi panjang konteks AliBi...
Teknik ini bukan sahaja membantu model memperoleh pemahaman yang lebih mendalam tentang konteks, tetapi juga meningkatkan keupayaan dialog dan interaksi semula jadi PhoGPT. Ini menjadikan model sebagai alat yang serba boleh dan fleksibel, mampu memenuhi pelbagai keperluan linguistik pengguna.
Dr. Bui Hai Hung menambah bahawa PhoGPT telah dibangunkan oleh syarikat itu dari awal, bebas daripada semua model lain di dunia . Dengan model sumber terbuka, komuniti di Vietnam boleh menggunakan dan memperbaikinya dengan lebih baik. Menjadikan kod sumber PhoGPT awam dan tersedia kepada pengguna membantu mewujudkan persekitaran di mana komuniti pengguna boleh membangunkan aplikasi tersuai dan unik.
Salah satu matlamat sumber terbuka adalah untuk meletakkan asas supaya orang ramai tidak perlu menghabiskan masa untuk membuat semula, unit boleh membangunkan lebih banyak model bahasa PhoGPT. Ini akan membantu masyarakat mempunyai komuniti sumber terbuka yang berkualiti untuk model bahasa Vietnam yang besar, mewujudkan kesan yang baik supaya banyak syarikat boleh mengambil bahagian dan memohon dalam bidang tertentu. Dengan PhoGPT, Syarikat Penyelidikan dan Aplikasi Kecerdasan Buatan VinAI berkata bahawa ia akan mempunyai rancangan untuk menyelidik dan membangunkan aplikasi untuk pengguna individu dan pakej penyelesaian sokongan khusus untuk perniagaan di Vietnam dalam bidang seperti penjagaan kesihatan, pendidikan, dsb.
PhoGPT telah meletakkan asas pertama untuk pembangunan model bahasa Vietnam berprestasi tinggi, sebagai asas untuk membangunkan aplikasi yang praktikal dan berkesan, sejajar dengan strategi pembangunan AI Kerajaan hingga 2030.
BA TAN
Sumber






Komen (0)