Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Jurutera muda menggunakan AI untuk mengubah cara menaip bahasa Vietnam

Perisian menaip Vietnam bersepadu AI adalah salah satu produk yang berjaya menggabungkan kreativiti dengan pengetahuan profesional, bertujuan untuk membawa nilai praktikal kepada masyarakat.

ZNewsZNews14/05/2025


Antara muka v7, papan kekunci bersepadu AI. Foto: NVCC .

Berkongsi dengan Tri Thuc - Znews , Tri Duc (lahir pada tahun 2003) bercakap tentang idea menggunakan kecerdasan buatan untuk mengubah cara kemasukan orang Vietnam. Alat menaip v7, projek pelajarnya, kini telah berkembang menjadi kertas penyelidikan dan telah diterima di IJCAI 2025, persidangan berprestij mengenai AI.

Walaupun popular selama beberapa dekad, menaip Telex atau VNI masih mempunyai banyak batasan dalam pengalaman pengguna. Oleh itu, v7 dilahirkan untuk menjadi alat ramalan ringan, membantu memendekkan masa untuk menaip Vietnam terima kasih kepada integrasi AI.

Semangat untuk bahasa dan teknologi

Kecintaannya terhadap bahasa dan teknologi membawanya ke jurusan Kecerdasan Buatan Gunaan di Universiti Teknologi Ho Chi Minh City.

Semasa pengajiannya, beliau mendekati projek seperti model bahasa besar (LLM) untuk bahasa Vietnam, perisian untuk menterjemah bahasa etnik minoriti, atau chatbot untuk menyokong kemasukan. "Pengalaman itu membantu saya mengumpul asas pengetahuan yang kukuh, memupuk semangat dan keinginan saya untuk menggunakan AI untuk mencipta produk berguna untuk masyarakat," kongsinya.

Papan kayu bersepadu foto AI 1

Tri Duc mahu membawa nilai daripada menerapkan AI kepada kehidupan. Foto: NVCC.

Di samping itu, dengan latar belakang dalam bahasa Mandarin dan Kantonis, Duc menyedari korelasi pinyin/jyutping dengan ejaan Vietnam. Faktor ini juga membuatkan anda melihat bahawa berbeza dengan kerumitan hieroglif, sistem menaip pinyin Cina hanya perlu memasukkan "yn" untuk mendapatkan nama negara kita dalam aksara Han. Manakala Telex atau VNI memerlukan 10 kekunci untuk mendapatkan perkataan “Vietnam”.

Melalui pemerhatiannya, Duc menyedari bahawa apabila berkomunikasi dengan cepat, pengguna sering menyingkatkan dengan mengekalkan konsonan pertama, seperti "hs" untuk "pelajar". "Jika manusia mudah memahami gaya penulisan ini, AI boleh memahaminya sepenuhnya jika dilatih dengan data yang betul," katanya mengenai keadaan yang menimbulkan idea itu.

Daripada perlu menulis aksara penuh dan kemudian menambah aksen apabila menggunakan alat menaip tradisional seperti Telex atau VNI yang mengikut mekanisme pelengkap, v7 menggunakan AI untuk mencadangkan perkataan yang ingin anda tulis. Teknologi ini akan meramalkan perkataan lengkap dengan tepat dengan kekunci paling sedikit yang mungkin.

Dalam struktur ejaan Vietnam, sesuatu perkataan terdiri daripada konsonan awal, rima dan nada. Sebagai contoh, perkataan "Nguyen" terdiri daripada "ng", "uyen", dan nada jatuh. Berdasarkan prinsip ini, enjin menaip v7 dibina untuk meramalkan perkataan lengkap dengan hanya konsonan dan nada awal, yang membantu mengurangkan bilangan ketukan kekunci dengan ketara sambil mengekalkan ketepatan.

Cabaran mengajar bahasa Vietnam kepada AI

Menurut Duc, cabaran terbesar ialah mengajar AI untuk "memahami" bahasa Vietnam untuk menyediakan alat menaip ini. Dia mencuba banyak model sebelum memilih GPT-2 sebagai asas, dengan seni bina Transformers untuk pemahaman konteks yang baik dan ramalan perkataan yang tepat.

Selepas memilih seni bina asas, Duc menggantikan sepenuhnya Tokenizer (pengekod perbendaharaan kata) dengan perbendaharaan kata Vietnam yang dibina sendiri. Jurutera menapis semua perkataan Vietnam yang sah dan dieja dengan betul untuk memastikan pemprosesan menyeluruh, meramalkan sebarang perkataan yang ingin ditulis oleh pengguna.

Cabaran lain terletak pada mengimbangi prestasi ramalan dan kelajuan tindak balas, memastikan model boleh berjalan dalam masa nyata pada kedua-dua komputer dan telefon, tetapi masih cukup berkuasa untuk membuat ramalan terbaik. Selepas dua bulan ujian berterusan, versi semasa membawa hampir 70% perkataan yang ditaip pengguna ke atas dengan betul, dengan kependaman hanya 0.03 saat.

Mengenai kaedah input papan kekunci, menurut banyak kajian yang Duc rujuk daripada ahli bahasa Cao Xuan Hao atau Henri Maspero, bahasa Vietnam bukan sahaja mempunyai 6, tetapi 8 nada. Untuk memanfaatkan ciri ini, v7 menggunakan sistem 8 nada dan bukannya 6 biasa (termasuk nada rata dan 5 nada aksen: tajam, rata, soalan, jatuh, berat). Dalam papan kekunci ini, apabila menaip "v7", model akan mencadangkan perkataan "Viet". Ini juga merupakan idea untuk nama produk.

Selepas berkongsi v7 di laman sosialnya, Duc berkata, dia sangat gembira dan terkejut apabila model itu mendapat perhatian, sokongan dan keinginan untuk merasai pengalaman. "Itu memberi saya perasaan yang jelas tentang keperluan untuk alat menaip Vietnam yang lebih bijak dan pantas," katanya.

Papan kayu bersepadu foto AI 2

Kumpulan pengarang artikel penyelidikan saintifik . Dari kiri: Nhat Khang, Hieu Nghia dan Tri Duc. Foto: NVCC.

Pada masa ini, papan kekunci masih dalam peringkat prototaip, dengan kod sumber terbuka pada GitHub untuk pengaturcara atau pengguna teknologi untuk menguji dan menyumbang. Versi aplikasi lengkap untuk Windows dan macOS juga sedang dibangunkan untuk pengguna biasa memasang dan menggunakan dengan mudah.

Pada masa hadapan, keutamaan utama untuk v7 ialah versi papan kekunci pada iPhone, untuk menambah baik cara teks Vietnam dimasukkan pada telefon pintar. Selain itu, model ini akan dipertingkatkan dalam ketepatan dengan melatih lebih banyak data perbualan harian, membantu AI lebih memahami konteks biasa.

Perjalanan Duc telah menyumbang kepada nafas kreativiti, mengikuti arah aliran teknologi dalam konteks Vietnam melabur banyak dalam infrastruktur AI. Satu detik yang membuatkan dia bangga ialah apabila v7 mula-mula mencipta ayat yang lengkap. "Itulah ketika model kecil, mungkin hanya 1/10,000 saiz ChatGPT hari ini, masih boleh berfikir seperti manusia," kata Duc.

Sumber: https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Komen (0)

No data
No data

Dalam topik yang sama

Dalam kategori yang sama

Kampung di Da Nang dalam 50 kampung tercantik di dunia 2025
Perkampungan kraf tanglung dibanjiri dengan tempahan semasa Perayaan Pertengahan Musim Luruh, dibuat sebaik sahaja tempahan dibuat.
Berayun dengan tidak menentu di tebing, berpaut pada batu untuk mengikis jem rumpai laut di pantai Gia Lai
48 jam memburu awan, menonton sawah, makan ayam di Y Ty

Daripada pengarang yang sama

Warisan

Rajah

Perniagaan

No videos available

Berita

Sistem Politik

Tempatan

produk