Pada acara Hari Kecerdasan Buatan 2023 bertema "AI - Membangun Kembali Realitas," yang diadakan pada tanggal 5 dan 6 Desember, Perusahaan Riset dan Aplikasi Kecerdasan Buatan VinAI ( Vingroup ) mengumumkan proyek penelitian sumber terbuka mereka tentang model bahasa besar khusus untuk bahasa Vietnam, yang disebut PhoGPT.
PhoGPT adalah proyek sumber terbuka, tidak seperti perangkat lunak berpemilik seperti ChatGPT milik OpenAI. Karena bersifat sumber terbuka, tidak ada batasan komersial; semua pihak dapat menggunakan PhoGPT untuk mengembangkan aplikasi mereka sendiri, termasuk aplikasi untuk tujuan komersial. Pada dasarnya, ini adalah platform bagi komunitas domestik yang mengembangkan aplikasi terkait AI.
Menurut Dr. Bui Hai Hung, Direktur Jenderal Perusahaan Riset dan Aplikasi Kecerdasan Buatan VinAI, keterbatasan model bahasa Vietnam yang ada menunjukkan bahwa model tersebut belum mencapai kinerja optimal dan kekurangan basis kode sumber terbuka. Oleh karena itu, salah satu tugas mendesak yang dihadapi komunitas AI secara umum, dan komunitas pemrosesan bahasa alami (NLP) secara khusus, adalah membangun model baru yang lebih andal yang mampu memproses bahasa Vietnam dengan akurasi dan efisiensi tinggi.
Para ahli AI percaya bahwa, dengan model bahasa big data yang berisi 7,5 miliar parameter, yang dibangun di atas platform decoding Transformer, model ini dilatih dari awal menggunakan teknik paling canggih yang tersedia, seperti Flash Attention dan ekstrapolasi panjang konteks AliBi.
Teknik-teknik ini tidak hanya membantu model memperoleh pemahaman konteks yang lebih mendalam, tetapi juga meningkatkan kemampuan PhoGPT untuk terlibat dalam dialog dan interaksi alami. Hal ini menjadikan model tersebut sebagai alat yang serbaguna dan fleksibel yang mampu memenuhi beragam kebutuhan bahasa penggunanya.
Dr. Bui Hai Hung menambahkan bahwa PhoGPT dikembangkan dari awal oleh perusahaan, secara independen dari semua model lain di seluruh dunia . Dengan model sumber terbukanya, komunitas di Vietnam dapat menggunakan dan mengembangkannya lebih lanjut. Dengan membuat kode sumber PhoGPT tersedia untuk umum dan mudah diakses oleh pengguna, terciptalah lingkungan dan komunitas di mana pengguna dapat mengembangkan aplikasi yang unik dan sesuai kebutuhan.
Salah satu tujuan open source adalah menciptakan platform di mana orang tidak perlu mengulang pekerjaan, sehingga memungkinkan organisasi untuk mengembangkan lebih lanjut model bahasa besar PhoGPT. Hal ini akan membantu masyarakat memiliki komunitas open source berkualitas untuk model bahasa besar Vietnam, menciptakan efek positif sehingga banyak perusahaan dapat berpartisipasi dan menerapkannya di berbagai bidang. Dengan PhoGPT, Perusahaan Riset dan Aplikasi Kecerdasan Buatan VinAI menyatakan bahwa mereka berencana untuk meneliti dan mengembangkan aplikasi untuk pengguna individu dan solusi dukungan komprehensif untuk bisnis dalam bahasa Vietnam di bidang-bidang seperti perawatan kesehatan dan pendidikan.
PhoGPT telah meletakkan fondasi pertama untuk pengembangan model bahasa Vietnam berkinerja tinggi, yang berfungsi sebagai dasar untuk mengembangkan aplikasi praktis dan efektif yang selaras dengan strategi pengembangan AI Pemerintah hingga tahun 2030.
BA TAN
Sumber






Komentar (0)