Pada acara Hari Kecerdasan Buatan 2023 dengan tema "AI - reka bentuk semula realiti" yang berlangsung pada 5 dan 6 Disember, Syarikat Penyelidikan dan Aplikasi Kecerdasan Buatan VinAI ( Vingroup Corporation) mengumumkan projek penyelidikan sumber terbuka mengenai model bahasa besar untuk bahasa Vietnam, PhoGPT.
PhoGPT ialah projek sumber terbuka dan bukannya perisian proprietari seperti ChatGPT OpenAI. Kerana ia adalah sumber terbuka, tiada had komersial, semua pihak boleh menggunakan PhoGPT untuk membangunkan aplikasi mereka sendiri, termasuk unit aplikasi untuk tujuan komersial. Ini bermakna ini seperti platform yang menyediakan komuniti membangunkan aplikasi berkaitan teknologi AI di negara ini.
Menurut Dr. Bui Hai Hung, Pengarah Besar Syarikat Penyelidikan dan Aplikasi Kecerdasan Buatan VinAI, batasan model Vietnam telah membuktikan bahawa model ini tidak mencapai prestasi optimum dan kekurangan kod sumber terbuka. Oleh itu, salah satu tugas mendesak untuk komuniti AI secara amnya, dan komuniti pemprosesan bahasa semula jadi (NLP) khususnya, adalah untuk membina model baharu yang lebih berkuasa yang mampu memproses bahasa Vietnam dengan ketepatan dan prestasi yang tinggi.
Pakar AI mengatakan bahawa dengan model bahasa data besar dengan 7.5 bilion parameter, dibina pada platform penyahkodan Transformer, model ini dilatih dari awal, menggunakan teknik paling canggih yang tersedia seperti mekanisme Flash Attention, ekstrapolasi panjang konteks AliBi...
Teknik ini bukan sahaja membantu model memperoleh pemahaman yang lebih mendalam tentang konteks, tetapi juga meningkatkan keupayaan dialog dan interaksi semula jadi PhoGPT. Ini menjadikan model alat serba boleh dan berbilang tugas, mampu memenuhi pelbagai keperluan linguistik pengguna.
Dr. Bui Hai Hung menambah bahawa PhoGPT telah dibangunkan oleh syarikat itu dari awal, bebas daripada semua model lain di dunia . Dengan model sumber terbuka, komuniti di Vietnam boleh menggunakan dan memperbaikinya dengan lebih baik. Menjadikan kod sumber PhoGPT awam dan tersedia kepada pengguna membantu mewujudkan persekitaran di mana komuniti pengguna boleh membangunkan aplikasi tersuai dan unik.
Salah satu matlamat sumber terbuka adalah untuk meletakkan asas supaya orang ramai tidak perlu menghabiskan masa untuk membuat semula, dan unit boleh membangunkan model bahasa yang lebih besar seperti PhoGPT. Ini akan membantu masyarakat mempunyai komuniti sumber terbuka yang berkualiti untuk model bahasa Vietnam yang besar, mewujudkan kesan yang baik supaya banyak syarikat boleh mengambil bahagian dan menerapkannya dalam bidang tertentu. Dengan PhoGPT, Syarikat Penyelidikan dan Aplikasi Kecerdasan Buatan VinAI berkata bahawa ia akan mempunyai rancangan untuk menyelidik dan membangunkan aplikasi untuk pengguna individu dan pakej penyelesaian sokongan khusus untuk perniagaan di Vietnam dalam bidang seperti penjagaan kesihatan, pendidikan, dsb.
PhoGPT telah meletakkan asas pertama untuk pembangunan model bahasa Vietnam berprestasi tinggi, sebagai asas untuk membangunkan aplikasi yang praktikal dan berkesan, sejajar dengan strategi pembangunan AI Kerajaan hingga 2030.
BA TAN
Sumber
Komen (0)