Menggabungkan AI untuk "mengajar" bahasa Vietnam
Pemimpin perusahaan pelaburan langsung asing (FDI) di Vietnam ingin mempelajari bahasa Vietnam dengan cepat dan dapat membaca 90% kandungan dokumen biasa. Masalahnya, dia terlalu sibuk dan hanya mempunyai masa lebih kurang 1 jam (dari 12-13j setiap hari) untuk belajar. Jadi, bagaimanakah teknologi harus digunakan pada perisian pembelajaran bahasa untuk membantunya mempelajari bahasa asing dengan cepat?
Di atas ialah masalah jawatan kepimpinan syarikat FDI yang dikemukakan kepada Profesor Madya, Dr. Dinh Dien, Pengarah Pusat Linguistik Pengiraan, Universiti Sains , Universiti Kebangsaan Vietnam, Ho Chi Minh City.
Sebagai seseorang yang mempunyai banyak topik penyelidikan saintifik dan penerbitan antarabangsa mengenai aplikasi kecerdasan buatan (AI) dalam terjemahan mesin, linguistik kritikal dan pengajaran bahasa Vietnam kepada orang asing, Profesor Madya Dien percaya bahawa aplikasi AI sangat diperlukan untuk menyelesaikan masalah dalam linguistik.
Secara khusus, langkah pertama dalam mempelajari mana-mana bahasa ialah mengajar bunyi bahasa. Halangan di sini ialah bahasa Vietnam mempunyai nada, irama, apabila mengajar pelajar bahasa bukan nada seperti bahasa Inggeris, Perancis, dll., ia akan menjadi sangat sukar. Sebagai contoh, bukannya bertanya: "Dah tidur ke belum?", pelajar akan berkata "Dah tidur ke belum?", kerana mereka tidak dapat membezakan nada. Ia adalah perlu untuk mengajar mereka di mana untuk meletakkan permainan semasa menyebut, cara memegang mulut, dan bagaimana sebutan yang betul atau salah adalah berbeza.
Pada masa ini, perisian aplikasi AI dalam pengajaran bahasa asing boleh mensimulasikan bentuk mulut memberus gigi, memainkan bunyi untuk ditiru oleh pelajar. Kemudian, pelajar memainkan semula bunyi, merekodkannya dalam perisian, menggunakan teknologi untuk membandingkan sebutan pelajar dengan sebutan standard daripada perisian, meningkatkan sebutan dengan cepat. Semua langkah di atas mesti menggunakan AI.
Contoh lain, menurut Kamus Vietnam Institut Linguistik yang disunting oleh mendiang Profesor Hoang Phe, perbendaharaan kata asal Vietnam mempunyai kira-kira 34,000 perkataan. Pengiraan menunjukkan bahawa adalah perlu untuk mengajar kira-kira 10% daripada perkataan kepada mesin, bersamaan dengan 3,400 perkataan maklumat aplikasi, supaya mesin boleh membaca kira-kira 90% daripada teks biasa Vietnam. Untuk mendapatkan jadual data ini, Profesor Madya Dien terpaksa menggunakan AI, melabelkan sistem perbendaharaan kata dalam korpus Vietnam.
Boleh dikatakan AI telah mengubah cara pengajaran dan pembelajaran dalam sektor pendidikan . Malah, banyak aplikasi kecerdasan buatan telah dilahirkan untuk menyokong proses pengajaran dan pembelajaran menjadi lebih pantas dan berkesan.
Kisah menarik menggabungkan sains komputer dan linguistik di atas menunjukkan bahawa proses latihan dan penerapan AI dalam amalan adalah sangat diperlukan, tetapi tidak mudah. Data perlu diasingkan kepada banyak lapisan pengenalan, pada setiap lapisan, setiap pembolehubah mesti diproses dengan pengecam khusus yang berbeza.
Apabila mesin belajar bahasa...
AI bukan sahaja membantu manusia mempelajari bahasa, ia juga membantu sistem yang menyokong kecerdasan bahasa dengan lebih baik. Mesin dilatih dan bertambah baik setiap hari.
Sama seperti kisah Profesor Madya Dien, di bawah adalah satu lagi contoh jelas tentang bagaimana seorang pembantu pintar memahami bahasa manusia.
Ia adalah proses menyelidik dan membangunkan pembantu suara Vietnam Kiki pada kereta, untuk mengenali suara dengan baik dengan banyak loghat serantau yang berbeza. Dalam sains komputer, pengecaman suara ialah cabang penting kecerdasan buatan (AI), menukar suara manusia kepada format yang berguna dan boleh difahami oleh aplikasi komputer. Teknologi ini adalah jambatan antara mesin dan manusia. Pembantu suara telah menjadi aplikasi yang sangat diperlukan di seluruh dunia . Yang paling popular ialah: Siri Apple, Google Assistant, Amazon Alexa atau Kiki di Vietnam.
Encik Nguyen Hoang Khanh Duy, yang menulis baris pertama kod untuk Kiki, berkongsi bahawa untuk melatih model AI yang cukup pintar untuk mengecam suara dan bertindak balas kepada pengguna dengan maklumat yang betul, data bahasa memainkan peranan penting.
Sebagai contoh, fungsi yang sangat penting untuk pengguna pembantu Vietnam Kiki pada kereta ialah navigasi. Oleh itu, pasukan pembangunan produk mesti menyediakan data dan perbendaharaan kata untuk "lancar" menyokong arahan daripada pengguna. Selepas proses mengumpul data dan melatih model, indeks yang menunjukkan kualiti pengecaman suara dalam versi terkemudian telah meningkat sebanyak 40% berbanding yang asal.
Pengecaman suara dalam kereta bukan sahaja terhad kepada masalah navigasi dan lokasi, tetapi juga meliputi banyak isu lain.
Sebagai contoh, penggunaan khusus Kiki dalam kereta memerlukan banyak bunyi dari enjin, angin atau peralatan lalu lintas di jalan raya, yang secara langsung menjejaskan kualiti pengecaman suara Kiki di dalam kereta. Oleh itu, pasukan Kiki dikehendaki cuba menyelesaikan keadaan bising dengan mempertingkatkan data dengan bercakap dalam keadaan bising agar sesuai dengan kehidupan sebenar.
Di samping itu, dengan teknik baharu di dunia seperti pembelajaran penyeliaan sendiri, Kiki cuba "belajar" daripada data yang tidak berlabel, untuk menambah baik lagi model. Kestabilan pembantu suara Vietnam ini bertambah baik dengan latihan berterusan dan peningkatan produk.
Jelas sekali, kemajuan teknologi berlaku setiap hari, setiap jam. ChatGPT, yang dilancarkan pada penghujung tahun 2022, telah menjawab sebahagian persoalan tentang cara data besar berfungsi. Teknologi sedang "melangkah" ke pertengahan kehidupan, terutama dalam pendidikan, bahasa, bidang yang sebelum ini banyak bergantung kepada manusia. AI mentakrifkan semula cara kita belajar, bekerja, hidup... seperti contoh khusus di atas.
Sumber
Komen (0)