Vietnam.vn - Nền tảng quảng bá Việt Nam

Jurutera muda menggunakan AI untuk mengubah cara bahasa Vietnam ditaip.

Papan kekunci Vietnam bersepadu AI merupakan salah satu produk yang berjaya menggabungkan kreativiti dengan kepakaran, bertujuan untuk membawa nilai praktikal kepada komuniti.

ZNewsZNews14/05/2025


Antara muka papan kekunci bersepadu AI v7. Foto: Disediakan oleh pengarang .

Bercakap kepada Tri Thức - Znews , Tri Duc (lahir pada tahun 2003) berkongsi ideanya untuk mengaplikasikan kecerdasan buatan bagi mengubah cara penggunaan bahasa Vietnam. Projek papan kekunci v7 beliau kini telah berkembang menjadi kertas penyelidikan dan telah diterima di IJCAI 2025, sebuah persidangan AI yang berprestij.

Walaupun popular selama beberapa dekad, kaedah input Telex atau VNI masih mempunyai banyak batasan dari segi pengalaman pengguna. Oleh itu, v7 dicipta untuk menjadi alat teks ramalan yang ringan, membantu memendekkan masa menaip bahasa Vietnam hasil daripada AI bersepadu.

Minat terhadap bahasa dan teknologi.

Minatnya terhadap bahasa dan teknologi telah membawa Duc kepada jurusan Kecerdasan Buatan Gunaan di Universiti Teknologi Bandar Raya Ho Chi Minh.

Semasa pengajiannya, beliau telah mengusahakan projek-projek seperti pemodelan bahasa berskala besar (LLM) untuk bahasa Vietnam, perisian untuk menterjemah bahasa etnik minoriti dan chatbot untuk menyokong pengambilan pelajar. “Pengalaman ini membantu saya membina asas pengetahuan yang kukuh, memupuk minat saya dan mendorong keinginan saya untuk mengaplikasikan AI bagi mencipta produk yang memberi manfaat kepada komuniti,” kongsinya.

Imej papan kayu bersepadu AI 1

Tri Duc berhasrat untuk menghidupkan nilai dengan mengaplikasikan AI. Foto: Disediakan oleh orang yang ditemu bual.

Tambahan pula, dengan latar belakang bahasa Mandarin dan Kantonis, Duc mengenali korelasi antara pinyin/jyutping dan ejaan Vietnam. Ini juga menunjukkan bahawa, bertentangan dengan kerumitan aksara ideografik, kaedah input pinyin Cina hanya memerlukan memasukkan "yn" untuk menghasilkan nama negara kita dalam aksara Cina. Sebaliknya, Telex atau VNI memerlukan 10 kekunci untuk menghasilkan "Vietnam".

Melalui pemerhatiannya, Duc menyedari bahawa dalam perbualan ringkas, pengguna sering memendekkan perkataan dengan mengekalkan konsonan awal, seperti "hs" untuk "pelajar." "Jika manusia dapat memahami gaya penulisan ini dengan mudah, AI benar-benar dapat memahaminya jika dilatih dengan data yang betul," jelasnya tentang keadaan yang membawa kepada ideanya.

Daripada menaip semua aksara dan kemudian menambah diakritik seperti kaedah input tradisional seperti Telex atau VNI, yang bergantung pada mekanisme pelengkap, v7 menggunakan AI untuk mencadangkan perkataan yang anda ingin tulis. Teknologi ini akan meramalkan perkataan lengkap dengan tepat dengan kekunci sesedikit mungkin.

Dalam ortografi Vietnam, perkataan terdiri daripada konsonan awal, vokal, dan nada. Contohnya, perkataan "Nguyễn" terdiri daripada "ng," "uyên," dan nada jatuh. Berdasarkan prinsip ini, kaedah input v7 telah dibangunkan untuk meramalkan perkataan lengkap hanya menggunakan konsonan dan nada awal, sekali gus mengurangkan bilangan ketukan kekunci dengan ketara sambil mengekalkan ketepatan.

Cabaran mengajar AI dalam bahasa Vietnam.

Menurut Duc, cabaran terbesar adalah mengajar AI untuk "memahami" bahasa Vietnam bagi menggunakan kaedah input ini. Beliau telah mencuba banyak model sebelum memilih GPT-2 sebagai asas, dengan seni bina Transformers yang menawarkan pemahaman kontekstual yang baik dan ramalan perkataan yang tepat.

Selepas memilih seni bina asas, Duc menggantikan sepenuhnya Tokenizer (pengekod perbendaharaan kata) dengan set perbendaharaan kata Vietnamnya sendiri. Jurutera tersebut menapis dan memasukkan semua perkataan Vietnam yang sah dan dieja dengan betul untuk memastikan keupayaan pemprosesan yang komprehensif dan keupayaan untuk meramalkan sebarang perkataan yang ingin ditulis oleh pengguna.

Satu lagi cabaran terletak pada keseimbangan prestasi ramalan dan kelajuan tindak balas, memastikan model boleh berjalan dalam masa nyata pada kedua-dua komputer dan telefon sambil kekal cukup berkuasa untuk memberikan ramalan terbaik. Selepas dua bulan ujian berterusan, versi semasa meletakkan hampir 70% perkataan yang dimasukkan pengguna di bahagian atas dengan betul, dengan kelewatan hanya 0.03 saat.

Berkenaan kaedah input papan kekunci, menurut beberapa kajian yang dirujuk oleh Duc daripada ahli bahasa Cao Xuan Hao dan Henri Maspero, bahasa Vietnam bukan sahaja mempunyai 6, tetapi sehingga 8 ton. Untuk memanfaatkan ciri ini, v7 menggunakan sistem 8-ton dan bukannya 6 biasa (termasuk satu ton paras dan 5 ton dengan aksen: akut, serius, soalan, tilde dan titik di bawah). Dalam papan kekunci ini, apabila anda memasukkan "v7", model akan mencadangkan perkataan "Viet". Ini juga merupakan idea di sebalik nama produk tersebut.

Selepas berkongsi v7 di media sosialnya, Duc berkata beliau sangat gembira dan terkejut kerana model itu menerima begitu banyak perhatian, sokongan dan keinginan untuk mencubanya. "Itu memberi saya gambaran yang jelas tentang keperluan untuk kaedah input Vietnam yang lebih pintar dan pantas," katanya.

Papan kayu bersepadu AI (imej 2)

Penulis kertas penyelidikan saintifik . Dari kiri ke kanan: Nhat Khang, Hieu Nghia, dan Tri Duc. Foto: Disediakan oleh penulis.

Pada masa ini, kaedah input masih dalam peringkat prototaip, dengan kod sumber terbuka pada GitHub untuk pengaturcara dan pengguna teknologi menguji dan menyumbang. Versi aplikasi lengkap untuk Windows dan macOS juga sedang dibangunkan untuk pengguna umum, menjadikannya mudah untuk dipasang dan digunakan.

Pada masa hadapan, keutamaan utama untuk v7 ialah versi papan kekunci iPhone, yang bertujuan untuk menambah baik cara teks Vietnam dimasukkan pada telefon pintar. Di samping itu, ketepatan model akan dipertingkatkan dengan melatihnya lebih lanjut tentang data perbualan harian, membantu AI memahami konteks umum dengan lebih baik.

Perjalanan Duc telah menyumbang kepada penyuntik gelombang inovasi, seiring dengan trend teknologi dalam konteks pelaburan kukuh Vietnam dalam infrastruktur AI. Satu detik yang membuatnya bangga ialah apabila v7 pertama kali mencipta ayat yang lengkap. "Ketika itulah model kecil, mungkin hanya 1/10000 saiz ChatGPT hari ini, masih boleh berfikir seperti manusia," kata Duc.

Sumber: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Komen (0)

Sila tinggalkan komen untuk berkongsi perasaan anda!

Dalam topik yang sama

Dalam kategori yang sama

Daripada pengarang yang sama

Warisan

Rajah

Perniagaan

Hal Ehwal Semasa

Sistem Politik

Tempatan

Produk

Happy Vietnam
Subuh yang damai

Subuh yang damai

Vietnam di hatiku

Vietnam di hatiku

Cat Ba di hatiku

Cat Ba di hatiku