Kerja penyelidikan untuk membantu meningkatkan ketepatan model pengecaman pertuturan masa nyata (Pengecaman Pertuturan Automatik Penstriman) oleh Le Duy Khanh - jurutera "GenZ" Zalo AI - akan diumumkan buat kali pertama di Persidangan Saintifik Antarabangsa , yang berlangsung di Greece pada September 2024.
Dengan topik " Meningkatkan Pengecaman Pertuturan Penstriman Dengan Perhatian Kontekstual Anjakan Masa Dan Penyamaran Konteks Kanan Dinamik " , kertas penyelidikan jurutera Zalo AI yang dilahirkan pada tahun 2000 mencapai skor hampir sempurna - 11/12 mata, melepasi pusingan semakan yang ketat dengan lebih daripada 2,000 kertas kerja yang mengambil bahagian dalam sesi Persidangan yang akan dibentangkan pada sesi Persidangan.
“ Saya amat berbangga kerana artikel saintifik pertama saya telah diiktiraf oleh persidangan saintifik yang berprestij dan saya berpeluang memperkenalkan pencapaian penyelidikan Vietnam kepada teknologi besar, pakar dan masyarakat antarabangsa ,” kongsi Le Duy Khanh.
Di bawah bimbingan Dr. Chau Thanh Duc - Ketua Jabatan Penyelidikan dan Pembangunan di Zalo AI, Pensyarah di Universiti Sains Semula Jadi (Universiti Nasional Kota Ho Chi Minh), projek penyelidikan ini dijangka memberi sumbangan penting untuk menaik taraf model pengecaman pertuturan, meningkatkan ketepatan imlak suara dan suara-ke-teks pada aplikasi Zalo.
" Mensintesis penyelidikan Zalo AI yang sangat praktikal ke dalam kertas saintifik dan membentangkannya di persidangan antarabangsa yang berprestij adalah sangat bermakna. Ia bukan sahaja menunjukkan kapasiti jurutera Vietnam, tetapi juga menunjukkan keinginan untuk berkongsi pengalaman dan menyumbang kepada pembangunan komuniti AI global," kata Dr. Chau Thanh Duc.
Sebelum ini, Zalo menyepadukan penyelidikan ini ke dalam aplikasi pemesejannya dari penghujung tahun 2023, membantu meningkatkan ketepatan ciri "komposisi mesej suara" dengan ketara. Ciri ini membolehkan pengguna mengarang mesej melalui suara dan bukannya menaip dengan tangan, menjimatkan masa dan menjadikannya lebih mudah dalam banyak situasi penggunaan. Pada masa yang sama, ketepatan ciri ini telah mencapai 95% dalam amalan; kadar keperluan untuk mengedit semula teks selepas mengarang melalui suara telah menurun daripada 6.4% kepada hanya 4.8%.
Menurut statistik Zalo, walaupun ciri itu masih dalam fasa ujian, ia telah menjana hampir 4.5 juta mesej setiap hari dan menarik kira-kira 3.2 juta pengguna bulanan (data dikemas kini hingga Jun 2024).
Sejak memulakan perjalanan perintisnya dalam penyelidikan AI pada 2017, Zalo sentiasa percaya dalam "memperkasakan" generasi muda. Pada masa ini, sehingga 31% pekerja Zalo tergolong dalam generasi GenZ. Pada tahun 2021, dua topik penyelidikan lain pasukan kejuruteraan AI Zalo berkaitan dengan teknologi pemprosesan pertuturan turut diiktiraf di Persidangan Antarabangsa Asia- Pasifik mengenai Kepintaran Buatan (PRICAI 2021). Terutama, pengarang kedua-dua topik ini adalah semua penyelidik muda di bawah umur 30 tahun.
Interspeech ialah persidangan antarabangsa yang lama, komprehensif dan berprestij mengenai Pemprosesan Pertuturan yang dianjurkan oleh Persatuan Komunikasi Pertuturan Antarabangsa. Tahun ini, persidangan dengan tema "Ucapan dan seterusnya " berlangsung dari 1-5 September 2024 di pulau Kos (Greece).






Komen (0)