Memasuki lobi lapangan terbang, di tengah-tengah kesibukan orang ramai yang pulang dari perjalanan perniagaan, Ho Minh Duc berhenti seketika untuk beberapa saat apabila dia mendengar suara wanita yang dikenali dan lembut membaca pengumuman pada sistem.
Kakitangan Vbee bekerja di ibu pejabat syarikat di Hanoi - Foto: NVCC
Dia tersenyum, berasa lega dan gembira seperti bertemu saudara mara. "Saudara mara" itu adalah salah satu daripada 20 suara AI yang Duc dan pasukan Vbee telah "makan dan tidur" selama beberapa hari dan bulan, mencurahkan sepenuh hati mereka ke dalam setiap baris bunyi, menjaga setiap nuansa suara untuk menjadikannya lebih semula jadi dan seperti manusia.
Permulaan bergelombang
Saya tidak tahu berapa kali Ketua Pegawai Eksekutif Ho Minh Duc dan CTO Nguyen Thi Thu Trang - dua pengasas Syarikat Saham Bersama Penyelesaian Data dan Perkhidmatan Vbee - telah mengalami perasaan gembira dan bangga.
Mereka bertemu "kenalan istimewa" dalam banyak situasi yang berbeza: suara yang jelas pada sistem pembesar suara sekolah, suara mesra di dalam bangunan atau suara profesional dari papan suis automatik banyak perniagaan.
Cetusan idea Vbee bukan lagi hanya hasil daripada algoritma dan kod, tetapi sebenarnya memasuki kehidupan, membuat sumbangan yang senyap tetapi kuat kepada banyak bidang.
Daripada pengenalan buku, alih suara filem kepada pengumuman pusat panggilan automatik, Vbee memberi nafas baharu kepada teknologi suara.
Sebagai "ibu" kepada teknologi teras TTS, Dr. Nguyen Thi Thu Trang sentiasa bercita-cita untuk membawa produk daripada teknologi sintesis pertuturan Vietnam - teknologi yang telah banyak usaha beliau lakukan sejak tesis kedoktorannya di Universiti Paris 11 - kepada pengguna sebenar.
Hari-hari awal Vbee adalah sukar. Walaupun percuma untuk dua tahun pertama, alat teks-ke-ucapan (TTS) hanya menarik penonton kecil. Tetapi kemudian COVID-19 bertukar menjadi titik perubahan yang tidak dijangka.
Berhadapan dengan peraturan ketat tentang penjarakan sosial, perniagaan seperti FE Credit, Momo, Viet Credit, Sacombank ... terpaksa mencari cara untuk menjangkau ribuan pelanggan. Pada masa itulah Vbee diberi peluang: daripada peringatan hutang kepada respons automatik, produk mereka segera menjadi penyelesaian yang optimum. Pada masa itu, pembantu maya dan pusat panggilan maya membawa sehingga 80% daripada hasil Vbee.
Apabila wabak berlalu dan ekonomi dunia merosot, Vbee menghadapi cabaran baharu. Gelombang AI generatif (GenAI) dan trend kandungan digital menghidupkan semula alat TTS. Hari ini, daripada TikTok ke YouTube, Facebook, suara AI Vbee ada di mana-mana.
"Banyak kandungan TTS disediakan oleh kami pada masa ini," Encik Ho Minh Duc dengan bangga berkongsi. Pada masa ini, bilangan pengguna sebenar Vbee telah melebihi 2 juta, dan jumlah ini masih meningkat secara berterusan sebanyak 20% setiap bulan.
Vbee telah melatih lebih 20 suara korporat berkualiti tinggi, dan jika anda mengira suara tersuai, mereka telah mencipta lebih 200 suara AI yang berbeza.
Dengan teknologi transkripsi suara baharu yang telah dikaji dan diuji baru-baru ini, suara baharu kini hanya memerlukan 3 minit data yang dirakam untuk dilatih dan bukannya 4 hingga berdozen jam rakaman seperti dua tahun lalu.
Ketua Pegawai Eksekutif Ho Minh Duc dan Ketua Pegawai Teknologi Nguyen Thi Thu Trang - dua pengasas Syarikat Saham Bersama Penyelesaian Data dan Perkhidmatan Vbee - Foto: NVCC
"Kami lebih memahami bahasa Vietnam"
Dalam perlumbaan untuk teknologi sintesis pertuturan, Ketua Pegawai Eksekutif Ho Minh Duc melihat masa apabila usaha inovasi teknologi akan secara beransur-ansur mencapai hadnya.
Menurutnya, Vbee bukan sahaja membangunkan teknologi teras untuk memproses pertuturan Vietnam, tetapi juga telah membina sistem teknologi yang mampu memahami bahasa Vietnam secara mendalam - dengan semua kehalusan, nada dan budaya unik yang hanya orang Vietnam tulen boleh memahami sepenuhnya.
Sebagai syarikat terkemuka dalam pasaran TTS di Vietnam, kedua-dua pemimpin Vbee percaya bahawa alat mereka telah menjadi standard untuk bacaan suara AI untuk bahasa Vietnam. Pengguna bukan sahaja menghargai ketepatan tetapi turut merasai "emosi" dalam setiap suara yang dibangunkan oleh Vbee.
Dalam bahasa Vietnam, sebagai contoh, hanya perkataan "lorong" mempunyai banyak nama berbeza bergantung pada wilayah seperti "hèm", "kiệt", "xếc" - setiap perkataan mempunyai nuansa berbeza yang perlu difahami oleh AI.
Untuk mencapai itu, Vbee telah melabur banyak dalam mengumpul set data sampel serta melabur dalam sistem pelayan yang berkuasa untuk latihan AI.
"Untuk membantu AI memahami dan memproses setiap nuansa serantau dengan betul, kami terpaksa membina set sampel yang tidak terkira banyaknya, dan kos pelayan pemprosesan juga sangat tinggi," kongsi CEO Ho Minh Duc.
Dr. Nguyen Thi Thu Trang telah menghabiskan lebih daripada 15 tahun menyelidik teknologi TTS teras Vbee untuk menyahkod nada dan tatabahasa Vietnam yang unik. Baginya, bahasa ibundanya adalah dunia halus yang penuh dengan nuansa ekspresif.
"Bahasa Vietnam saya sangat kompleks dan menarik, nadanya adalah yang paling sukar dan berbeza daripada banyak bahasa popular lain di dunia. Semakin saya memahami bahasa itu, semakin tepat model saya," jelasnya.
Vbee secara beransur-ansur menegaskan bahawa mereka akan menjadi bahagian yang sangat diperlukan dalam alatan dan peranti dengan perisian pemprosesan bahasa Vietnam bersepadu dalam era teknologi.
Dalam setiap perkataan, setiap suara, pasukan Vbee bukan sahaja menyelidik dan membangunkan teknologi tetapi juga berusaha untuk mencipta "emosi Vietnam" yang benar-benar dalam suara AI mereka.
Nama Vbee adalah singkatan daripada frasa "Vietnamese BE your Eyes", yang berasal dari keinginan awal saya untuk membina alat yang menjadi "mata" bagi mereka yang cacat penglihatan. Tetapi dalam trend perkembangan semasa, apabila ramai orang ingin beralih kepada mendengar lebih daripada melihat, kami percaya bahawa Vbee juga akan menjadi "mata" semua orang.
Dr. Nguyen Thi Thu Trang (Pensyarah, Pusat Pengajian Teknologi Maklumat, Universiti Sains dan Teknologi Hanoi, Pengasas dan Pengarah Teknologi Syarikat Vbee)
Pertemuan pencinta buku audio
Vbee lahir daripada hubungan antara Dr. Nguyen Thi Thu Trang dan masyarakat buta. Sejak zaman pelajarnya, dia telah mengambil bahagian dalam merakam buku audio dan membangunkan pembaca Vietnam untuk menyokong orang buta.
Pengalaman ini memberi inspirasi kepadanya untuk membangunkan perisian bacaan Vietnam - pendahulu Vbee. Pada tahun 2018, beliau dan Encik Ho Minh Duc - rakan sekelas di Universiti Sains dan Teknologi Hanoi yang berpengalaman daripada projek Socbay.com dan mendigitalkan buku audio - mengasaskan Vbee, perintis dalam bidang penukaran teks ke pertuturan di Vietnam.
Pencapaian Cemerlang Vbee
- Hadiah pertama Qualcomm Vietnam Innovation Challenge 2024
- Anugerah Khas Tuoi Tre Start-up Award 2023
- Memenangi permulaan dalam program Grab Venture Ignite 2020 Accelerator
- Hadiah pertama Bakat Vietnam 2018, hadiah kedua Bakat Vietnam 2020
- Sijil Teknologi Teras Vietnam dalam Program Transformasi Digital Kebangsaan 2025 - 2030 Kementerian Penerangan dan Komunikasi
- Memenangi projek dalam Anugerah Media Digital Vietnam 2018 dan Dana Vingroup 2019.
Penglihatan serantau
Selepas mengesahkan kedudukannya dalam pasaran Vietnam, Vbee menyasarkan untuk berkembang ke Asia Tenggara dengan rancangan untuk membawa teknologi TTSnya ke negara-negara seperti Laos, Thailand, Kemboja dan Filipina menjelang 2026.
Menurut Dr. Nguyen Thi Thu Trang, kemajuan pesat teknologi hari ini dengan kemunculan model berbilang bahasa akan memudahkan untuk membangunkan alat TTS untuk bahasa lain.
Pada masa ini, beliau sedang menyelidik teknologi pertuturan untuk bahasa Thai, Cina dan Inggeris, membuka langkah baharu untuk Vbee di pasaran antarabangsa.
Sumber: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Komen (0)