Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Insinyur muda menggunakan AI untuk mengubah cara mengetik bahasa Vietnam

Perangkat lunak pengetikan bahasa Vietnam yang terintegrasi dengan AI merupakan salah satu produk yang berhasil memadukan kreativitas dengan pengetahuan profesional, yang bertujuan menghadirkan nilai praktis bagi masyarakat.

ZNewsZNews14/05/2025


Antarmuka keyboard v7 yang terintegrasi dengan AI. Foto: NVCC .

Berbagi dengan Tri Thuc - Znews , Tri Duc (lahir tahun 2003) berbicara tentang ide penerapan kecerdasan buatan untuk mengubah cara mengetik bahasa Vietnam. Alat pengetikan v7, proyek mahasiswanya, kini telah dikembangkan menjadi makalah penelitian dan diterima di IJCAI 2025, sebuah konferensi bergengsi tentang AI.

Meskipun populer selama beberapa dekade, pengetikan Telex atau VNI masih memiliki banyak keterbatasan dalam hal pengalaman pengguna. Oleh karena itu, v7 diciptakan untuk menjadi alat prediksi yang ringan, membantu mempersingkat waktu mengetik bahasa Vietnam berkat integrasi AI.

Gairah untuk bahasa dan teknologi

Kecintaannya terhadap bahasa dan teknologi membawanya mengambil jurusan Kecerdasan Buatan Terapan di Universitas Teknologi Kota Ho Chi Minh.

Selama masa studinya, ia mengerjakan proyek-proyek seperti model bahasa berskala besar (LLM) untuk bahasa Vietnam, perangkat lunak untuk menerjemahkan bahasa-bahasa etnis minoritas, atau chatbot untuk mendukung penerimaan mahasiswa baru. "Pengalaman-pengalaman tersebut membantu saya membangun fondasi pengetahuan yang kokoh, memupuk hasrat dan keinginan saya untuk menerapkan AI guna menciptakan produk-produk yang bermanfaat bagi masyarakat," ujarnya.

Papan kayu terintegrasi foto AI 1

Tri Duc ingin memberikan nilai tambah dari penerapan AI dalam kehidupan nyata. Foto: NVCC.

Selain itu, dengan latar belakang bahasa Mandarin dan Kanton, Duc menyadari korelasi pinyin/jyutping dengan ejaan bahasa Vietnam. Faktor ini juga menunjukkan bahwa, berbeda dengan kerumitan hieroglif, sistem pengetikan pinyin Tiongkok hanya perlu memasukkan "yn" untuk mendapatkan nama negara kita dalam aksara Han. Sementara Telex atau VNI membutuhkan 10 tombol untuk mendapatkan kata "Vietnam".

Melalui pengamatannya, Duc menyadari bahwa ketika berkomunikasi dengan cepat, pengguna sering menyingkat dengan mempertahankan konsonan pertama, seperti "hs" untuk "mahasiswa". "Jika manusia dapat dengan mudah memahami gaya penulisan ini, AI dapat sepenuhnya memahaminya jika dilatih dengan data yang tepat," ujarnya tentang keadaan yang memunculkan ide tersebut.

Alih-alih harus menulis karakter lengkap lalu menambahkan aksen saat menggunakan alat ketik tradisional seperti Telex atau VNI yang mengikuti mekanisme komplementer, v7 menggunakan AI untuk menyarankan kata yang ingin Anda tulis. Teknologi ini akan memprediksi kata lengkap secara akurat dengan tombol sesedikit mungkin.

Dalam struktur ejaan bahasa Vietnam, sebuah kata terdiri dari konsonan awal, rima, dan nada. Misalnya, kata "Nguyen" terdiri dari "ng", "uyen", dan nada menurun. Berdasarkan prinsip ini, mesin ketik v7 dirancang untuk memprediksi kata lengkap hanya dengan konsonan awal dan nada, yang membantu mengurangi jumlah penekanan tombol secara signifikan sekaligus menjaga akurasi.

Tantangan Mengajarkan Bahasa Vietnam kepada AI

Menurut Duc, tantangan terbesarnya adalah mengajarkan AI untuk "memahami" bahasa Vietnam agar dapat menggunakan alat pengetikan ini. Ia mencoba banyak model sebelum memilih GPT-2 sebagai fondasinya, dengan arsitektur Transformers untuk pemahaman konteks yang baik dan prediksi kata yang akurat.

Setelah memilih arsitektur yang mendasarinya, Duc sepenuhnya mengganti Tokenizer (pengkode kosakata) dengan kosakata Vietnam yang ia buat sendiri. Insinyur tersebut menyaring semua kata Vietnam yang valid dan dieja dengan benar untuk memastikan pemrosesan yang komprehensif, memprediksi kata apa pun yang ingin ditulis pengguna.

Tantangan lainnya terletak pada keseimbangan performa prediktif dan kecepatan respons, memastikan model dapat berjalan secara real-time di komputer dan ponsel, namun tetap cukup andal untuk menghasilkan prediksi terbaik. Setelah dua bulan pengujian berkelanjutan, versi terbaru berhasil mencapai hampir 70% kata yang diketik pengguna dengan tepat, dengan latensi hanya 0,03 detik.

Mengenai metode input kibor, menurut banyak penelitian yang dikonsultasikan Duc dengan ahli bahasa Cao Xuan Hao atau Henri Maspero, bahasa Vietnam tidak hanya memiliki 6, tetapi 8 nada. Untuk memanfaatkan fitur ini, v7 menggunakan sistem 8 nada, bukan 6 nada seperti biasanya (termasuk nada datar dan 5 nada aksen: tajam, datar, tanya, menurun, dan berat). Pada kibor ini, saat mengetik "v7", model akan menyarankan kata "Viet". Hal ini juga menjadi ide untuk nama produknya.

Setelah membagikan v7 di media sosialnya, Duc mengatakan bahwa ia sangat senang dan terkejut ketika model tersebut mendapat perhatian, dukungan, dan keinginan untuk mencobanya. "Hal itu memberi saya pemahaman yang jelas tentang perlunya alat pengetikan Vietnam yang lebih cerdas dan cepat," ujarnya.

Papan kayu terintegrasi foto AI 2

Kelompok penulis artikel penelitian ilmiah . Dari kiri: Nhat Khang, Hieu Nghia, dan Tri Duc. Foto: NVCC.

Saat ini, papan ketik ini masih dalam tahap prototipe, dengan kode sumber terbuka di GitHub yang dapat diuji dan disumbangkan oleh para programmer atau pengguna teknologi. Versi aplikasi lengkap untuk Windows dan macOS juga sedang dikembangkan agar mudah dipasang dan digunakan oleh pengguna umum.

Ke depannya, prioritas utama untuk v7 adalah versi keyboard di iPhone, untuk meningkatkan cara mengetik teks Vietnam di ponsel pintar. Selain itu, akurasi model akan ditingkatkan dengan pelatihan lebih lanjut pada data percakapan sehari-hari, yang akan membantu AI lebih memahami konteks umum.

Perjalanan Duc telah berkontribusi pada lahirnya kreativitas, mengikuti tren teknologi dalam konteks Vietnam yang berinvestasi besar-besaran dalam infrastruktur AI. Salah satu momen yang membuatnya bangga adalah ketika v7 pertama kali menciptakan kalimat lengkap. "Saat itulah sebuah model kecil, mungkin hanya 1/10.000 ukuran ChatGPT saat ini, masih dapat berpikir seperti manusia," kata Duc.

Sumber: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Komentar (0)

No data
No data

Dalam topik yang sama

Dalam kategori yang sama

Desa di Da Nang masuk dalam 50 desa terindah di dunia tahun 2025
Desa kerajinan lentera dibanjiri pesanan selama Festival Pertengahan Musim Gugur, dibuat segera setelah pesanan ditempatkan.
Berayun tak tentu arah di tebing, berpegangan pada batu untuk mengikis selai rumput laut di pantai Gia Lai
48 jam berburu awan, melihat sawah, makan ayam di Y Ty

Dari penulis yang sama

Warisan

Angka

Bisnis

No videos available

Berita

Sistem Politik

Lokal

Produk