Antarmuka v7, keyboard terintegrasi AI. Foto: Disediakan oleh penulis . |
Berbicara kepada Tri Thức - Znews , Tri Duc (lahir tahun 2003) berbagi idenya tentang penerapan kecerdasan buatan untuk mengubah cara memasukkan bahasa Vietnam. Proyek keyboard v7-nya kini telah berkembang menjadi makalah penelitian dan telah diterima di IJCAI 2025, sebuah konferensi AI bergengsi.
Meskipun populer selama beberapa dekade, metode input Telex atau VNI masih memiliki banyak keterbatasan dalam hal pengalaman pengguna. Oleh karena itu, v7 diciptakan sebagai alat teks prediktif yang ringan, membantu mempersingkat waktu pengetikan bahasa Vietnam berkat AI terintegrasi.
Ketertarikan yang besar terhadap bahasa dan teknologi.
Kecintaannya pada bahasa dan teknologi mendorong Duc untuk mengambil jurusan Kecerdasan Buatan Terapan di Universitas Teknologi Kota Ho Chi Minh.
Selama studinya, ia mengerjakan proyek-proyek seperti pemodelan bahasa skala besar (LLM) untuk bahasa Vietnam, perangkat lunak untuk menerjemahkan bahasa etnis minoritas, dan chatbot untuk mendukung perekrutan mahasiswa. “Pengalaman-pengalaman ini membantu saya membangun fondasi pengetahuan yang solid, memupuk gairah saya, dan memicu keinginan saya untuk menerapkan AI guna menciptakan produk yang bermanfaat bagi masyarakat,” ujarnya.
Tri Duc bertujuan untuk memberikan nilai tambah bagi kehidupan dengan menerapkan AI. Foto: Disediakan oleh narasumber. |
Selain itu, dengan latar belakang bahasa Mandarin dan Kanton, Duc menyadari korelasi antara pinyin/jyutping dan ejaan bahasa Vietnam. Hal ini juga menunjukkan bahwa, berbeda dengan kompleksitas karakter ideografis, metode input pinyin Tiongkok hanya memerlukan penekanan "yn" untuk menghasilkan nama negara kita dalam aksara Tiongkok. Sebaliknya, Telex atau VNI memerlukan 10 tombol untuk menghasilkan "Vietnam".
Melalui pengamatannya, Duc menyadari bahwa dalam percakapan singkat, pengguna sering menyingkat dengan mempertahankan konsonan awal, seperti "hs" untuk "student" (siswa). "Jika manusia dapat dengan mudah memahami gaya penulisan ini, AI pasti dapat memahaminya jika dilatih dengan data yang tepat," jelasnya tentang keadaan yang mengarah pada idenya.
Alih-alih mengetik semua karakter dan kemudian menambahkan diakritik seperti pada metode input tradisional seperti Telex atau VNI, yang bergantung pada mekanisme pelengkap, v7 menggunakan AI untuk menyarankan kata-kata yang ingin Anda tulis. Teknologi ini akan secara akurat memprediksi kata lengkap dengan jumlah tombol sesedikit mungkin.
Dalam ortografi Vietnam, sebuah kata terdiri dari konsonan awal, vokal, dan nada. Misalnya, kata "Nguyễn" terdiri dari "ng," "uyên," dan nada jatuh. Berdasarkan prinsip ini, metode input v7 dikembangkan untuk memprediksi kata lengkap hanya menggunakan konsonan awal dan nada, secara signifikan mengurangi jumlah penekanan tombol sambil mempertahankan akurasi.
Tantangan mengajarkan bahasa Vietnam kepada AI.
Menurut Duc, tantangan terbesar adalah mengajari AI untuk "memahami" bahasa Vietnam agar dapat menggunakan metode input ini. Dia mencoba banyak model sebelum memilih GPT-2 sebagai dasarnya, dengan arsitektur Transformer yang menawarkan pemahaman kontekstual yang baik dan prediksi kata yang akurat.
Setelah memilih arsitektur dasarnya, Duc sepenuhnya mengganti Tokenizer (encoder kosakata) dengan kumpulan kosakata bahasa Vietnam buatannya sendiri. Insinyur tersebut menyaring dan memasukkan semua kata bahasa Vietnam yang valid dan dieja dengan benar untuk memastikan kemampuan pemrosesan yang komprehensif dan kemampuan untuk memprediksi kata apa pun yang ingin ditulis pengguna.
Tantangan lainnya terletak pada menyeimbangkan kinerja prediktif dan kecepatan respons, memastikan model dapat berjalan secara real-time baik di komputer maupun ponsel, sekaligus tetap cukup mumpuni untuk memberikan prediksi terbaik. Setelah dua bulan pengujian terus menerus, versi saat ini berhasil menempatkan hampir 70% kata yang dimasukkan pengguna di bagian atas, dengan penundaan hanya 0,03 detik.
Mengenai metode input keyboard, menurut beberapa studi yang dikonsultasikan Duc dari ahli bahasa Cao Xuan Hao dan Henri Maspero, bahasa Vietnam tidak hanya memiliki 6, tetapi hingga 8 nada. Untuk memanfaatkan karakteristik ini, v7 menggunakan sistem 8 nada, bukan 6 nada seperti biasanya (termasuk satu nada datar dan 5 nada dengan aksen: akut, grave, tanya, tilde, dan titik di bawah). Pada keyboard ini, ketika Anda memasukkan "v7", model akan menyarankan kata "Viet". Ini juga merupakan ide di balik nama produk tersebut.
Setelah membagikan v7 di media sosialnya, Duc mengatakan bahwa ia sangat senang dan terkejut model tersebut mendapat begitu banyak perhatian, dukungan, dan keinginan untuk mencobanya. "Itu memberi saya pemahaman yang jelas tentang kebutuhan akan metode input bahasa Vietnam yang lebih cerdas dan cepat," katanya.
Para penulis makalah penelitian ilmiah tersebut. Dari kiri ke kanan: Nhat Khang, Hieu Nghia, dan Tri Duc. Foto: Disediakan oleh penulis. |
Saat ini, metode input masih dalam tahap prototipe, dengan kode sumber terbuka di GitHub agar para programmer dan pengguna teknologi dapat menguji dan berkontribusi. Versi aplikasi lengkap untuk Windows dan macOS juga sedang dikembangkan untuk pengguna umum, sehingga mudah diinstal dan digunakan.
Di masa mendatang, prioritas utama untuk v7 adalah versi keyboard iPhone, yang bertujuan untuk meningkatkan cara memasukkan teks bahasa Vietnam di ponsel pintar. Selain itu, akurasi model akan ditingkatkan dengan melatihnya lebih lanjut menggunakan data percakapan sehari-hari, membantu AI lebih memahami konteks umum.
Perjalanan Duc telah berkontribusi dalam menyuntikkan gelombang inovasi, mengikuti perkembangan tren teknologi dalam konteks investasi kuat Vietnam dalam infrastruktur AI. Salah satu momen yang membuatnya bangga adalah ketika v7 pertama kali menciptakan kalimat lengkap. "Saat itulah sebuah model kecil, mungkin hanya 1/10000 ukuran ChatGPT saat ini, masih bisa berpikir seperti manusia," kata Duc.
Sumber: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






Komentar (0)