Memasuki lobi bandara, di tengah hiruk pikuk orang-orang yang kembali dari perjalanan bisnis, Ho Minh Duc berhenti sejenak selama beberapa detik ketika ia mendengar suara wanita yang lembut dan familiar membacakan pengumuman di sistem.
Staf Vbee sedang bekerja di kantor pusat perusahaan di Hanoi - Foto: NVCC
Ia tersenyum, merasa lega dan bahagia seolah telah bertemu seorang saudara. "Saudara" itu adalah salah satu dari 20 suara AI yang telah "dimakan dan tiduri" Duc dan tim Vbee selama berhari-hari dan berbulan-bulan, mencurahkan segenap hati mereka ke dalam setiap baris suara, memperhatikan setiap nuansa suara agar lebih alami dan menyerupai manusia.
Awal yang sulit
Saya tidak tahu berapa kali CEO Ho Minh Duc dan CTO Nguyen Thi Thu Trang - dua pendiri Vbee Data Solutions and Services Joint Stock Company - telah mengalami perasaan gembira dan bangga seperti itu.
Mereka bertemu dengan "kenalan istimewa" dalam banyak situasi berbeda: suara jelas pada sistem pengeras suara sekolah, suara hangat di gedung, atau suara profesional dari panel listrik otomatis di banyak bisnis.
Gagasan Vbee tidak lagi sekadar hasil algoritma dan kode, tetapi benar-benar terwujud, memberikan kontribusi yang diam-diam tetapi kuat di banyak bidang.
Dari pengenalan buku, sulih suara film hingga pengumuman pusat panggilan otomatis, Vbee memberikan kehidupan baru ke dalam teknologi suara.
Sebagai "induk" teknologi inti TTS, Dr. Nguyen Thi Thu Trang selalu bercita-cita untuk menghadirkan produk-produk teknologi sintesis ucapan Vietnam - teknologi yang telah ia dedikasikan dengan sepenuh hati sejak disertasi doktoralnya di Universitas Paris 11 - kepada pengguna nyata.
Masa-masa awal Vbee penuh gejolak. Meskipun gratis selama dua tahun pertama, alat text-to-speech (TTS)-nya hanya menarik sedikit pengguna. Namun, COVID-19 kemudian menjadi titik balik yang tak terduga.
Menghadapi peraturan ketat tentang jaga jarak sosial, bisnis seperti FE Credit, Momo, Viet Credit, Sacombank ... harus menemukan cara untuk menjangkau ribuan pelanggan. Saat itulah Vbee diberi kesempatan: mulai dari pengingat utang hingga respons otomatis, produk mereka langsung menjadi solusi optimal. Saat itu, asisten virtual dan pusat panggilan virtual menyumbang hingga 80% pendapatan Vbee.
Ketika pandemi berlalu dan ekonomi dunia merosot, Vbee menghadapi tantangan baru. Gelombang AI generatif (GenAI) dan tren konten digital menghidupkan kembali perangkat TTS. Kini, dari TikTok hingga YouTube dan Facebook, suara AI Vbee hadir di mana-mana.
"Saat ini kami menyediakan banyak konten TTS," ujar Bapak Ho Minh Duc dengan bangga. Saat ini, jumlah pengguna Vbee telah melampaui 2 juta, dan angka ini terus meningkat secara konsisten sebesar 20% setiap bulannya.
Vbee telah melatih lebih dari 20 suara korporat berkualitas tinggi, dan jika Anda menghitung suara khusus, mereka telah menciptakan lebih dari 200 suara AI yang berbeda.
Dengan teknologi transkripsi suara baru yang baru-baru ini diteliti dan diuji, suara baru kini hanya memerlukan 3 menit data rekaman untuk dilatih, bukan 4 hingga puluhan jam rekaman seperti dua tahun lalu.
CEO Ho Minh Duc dan Chief Technology Officer Nguyen Thi Thu Trang - dua pendiri Vbee Data Solutions and Services Joint Stock Company - Foto: NVCC
"Kami lebih baik dalam memahami bahasa Vietnam"
Dalam perlombaan teknologi sintesis ucapan, CEO Ho Minh Duc melihat suatu masa ketika upaya inovasi teknologi secara bertahap akan mencapai batasnya.
Menurutnya, Vbee tidak hanya mengembangkan teknologi inti untuk memproses ucapan orang Vietnam, tetapi juga telah membangun sistem teknologi yang mampu memahami bahasa Vietnam secara mendalam - dengan semua kehalusan, nada, dan budaya unik yang hanya dapat dipahami sepenuhnya oleh orang Vietnam sejati.
Sebagai perusahaan terkemuka di pasar TTS di Vietnam, kedua pemimpin Vbee yakin bahwa perangkat mereka telah menjadi standar pembacaan suara AI untuk bahasa Vietnam. Pengguna tidak hanya menghargai akurasinya, tetapi juga merasakan "emosi" dalam setiap suara yang dikembangkan oleh Vbee.
Dalam bahasa Vietnam, misalnya, kata "gang" saja memiliki banyak nama berbeda, tergantung pada daerahnya, seperti "hèm", "kiệt", "xếc" - setiap kata memiliki nuansa berbeda yang perlu dipahami AI.
Untuk mencapainya, Vbee telah berinvestasi besar dalam pengumpulan kumpulan data sampel serta berinvestasi dalam sistem server yang kuat untuk pelatihan AI.
"Untuk membantu AI memahami dan memproses setiap nuansa regional dengan tepat, kami harus membangun set sampel yang tak terhitung jumlahnya, dan biaya server pemrosesannya pun sangat tinggi," ungkap CEO Ho Minh Duc.
Dr. Nguyen Thi Thu Trang telah menghabiskan lebih dari 15 tahun meneliti teknologi inti TTS Vbee untuk menguraikan nada dan tata bahasa Vietnam yang unik. Baginya, bahasa ibunya adalah dunia halus yang penuh dengan nuansa ekspresif.
Bahasa Vietnam saya sangat kompleks dan menarik, nadanya paling sulit dan berbeda dari banyak bahasa populer lainnya di dunia. Semakin saya memahami bahasanya, semakin akurat model saya nantinya," jelasnya.
Vbee secara bertahap menegaskan bahwa mereka akan menjadi bagian tak terpisahkan dari peralatan dan perangkat dengan perangkat lunak pemrosesan bahasa Vietnam terintegrasi di era teknologi.
Dalam setiap kata, setiap suara, tim Vbee tidak hanya meneliti dan mengembangkan teknologi tetapi juga berupaya menciptakan "emosi Vietnam" yang sesungguhnya dalam suara AI mereka.
Nama Vbee merupakan singkatan dari frasa "Vietnamese BE your Eyes", yang berasal dari keinginan awal saya untuk menciptakan alat yang menjadi "mata" bagi para tunanetra. Namun, dalam tren perkembangan saat ini, ketika banyak orang ingin beralih ke mendengar daripada melihat, kami yakin Vbee juga akan menjadi "mata" bagi semua orang.
Dr. Nguyen Thi Thu Trang (Dosen, Sekolah Teknologi Informasi, Universitas Sains dan Teknologi Hanoi, Pendiri dan Direktur Teknologi Perusahaan Vbee)
Pertemuan para pecinta buku audio
Vbee lahir dari hubungan antara Dr. Nguyen Thi Thu Trang dan komunitas tunanetra. Sejak masa kuliahnya, ia telah berpartisipasi dalam perekaman buku audio dan pengembangan buku bacaan berbahasa Vietnam untuk mendukung para tunanetra.
Pengalaman-pengalaman ini menginspirasinya untuk mengembangkan perangkat lunak membaca bahasa Vietnam—pendahulu Vbee. Pada tahun 2018, ia dan Bapak Ho Minh Duc—seorang teman sekelas di Universitas Sains dan Teknologi Hanoi yang berpengalaman dalam proyek Socbay.com dan digitalisasi buku audio—mendirikan Vbee, sebuah perusahaan pionir di bidang konversi teks-ke-ucapan di Vietnam.
Prestasi Luar Biasa Vbee
- Hadiah pertama Qualcomm Vietnam Innovation Challenge 2024
- Penghargaan Khusus Tuoi Tre Start-up Award 2023
- Start-up pemenang dalam program Akselerator Grab Venture Ignite 2020
- Juara pertama Bakat Vietnam 2018, juara kedua Bakat Vietnam 2020
- Sertifikat Teknologi Inti Vietnam dalam Program Transformasi Digital Nasional 2025 - 2030 Kementerian Informasi dan Komunikasi
- Proyek pemenang Vietnam Digital Media Award 2018 dan Vingroup Fund 2019.
Visi regional
Setelah menegaskan posisinya di pasar Vietnam, Vbee bertujuan untuk berekspansi ke Asia Tenggara dengan rencana untuk membawa teknologi TTS-nya ke negara-negara seperti Laos, Thailand, Kamboja, dan Filipina pada tahun 2026.
Menurut Dr. Nguyen Thi Thu Trang, kemajuan teknologi yang pesat saat ini dengan munculnya model multibahasa akan memudahkan pengembangan alat TTS untuk bahasa lain.
Saat ini, ia sedang meneliti teknologi ucapan untuk bahasa Thailand, Mandarin, dan Inggris, yang membuka langkah baru bagi Vbee di pasar internasional.
[iklan_2]
Sumber: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Komentar (0)