Ho Minh Duc, iş seyahatinden dönen insanların koşuşturmacası arasında havaalanının bekleme salonuna girdiğinde, sistemde bir anons okuyan tanıdık, nazik bir kadın sesini duyduğunda birkaç saniye durdu.
Vbee'nin personeli Hanoi'deki şirket merkezinde çalışıyor - Fotoğraf: NVCC
Sanki bir akrabasıyla karşılaşmış gibi rahatlamış ve mutlu bir şekilde gülümsedi. O "akraba", Duc ve Vbee ekibinin günlerce ve aylarca "birlikte yiyip içtiği", her ses dizisine tüm kalbini kattığı, sesin her nüansına özen göstererek onları daha doğal ve insansı hale getiren 20 yapay zeka sesinden biriydi.
Engebeli başlangıç
Vbee Data Solutions and Services Anonim Şirketi'nin kurucuları olan CEO Ho Minh Duc ve CTO Nguyen Thi Thu Trang'ın böylesine bir sevinç ve gurur duygusunu kaç kez yaşadıklarını bilmiyorum.
Okul hoparlörlerinden gelen berrak sesler, binalardaki sıcak sesler veya birçok işyerinin otomatik santrallerinden gelen profesyonel sesler gibi pek çok farklı durumda "özel tanıdıklarla" karşılaştılar.
Vbee'nin beyin çocukları artık sadece algoritmaların ve kodların bir sonucu değil, aynı zamanda hayata geçiyor ve birçok alana sessiz ama güçlü katkılarda bulunuyor.
Kitap tanıtımlarından, film dublajlarına, otomatik çağrı merkezi anonslarına kadar Vbee, ses teknolojisine yeni bir soluk getirdi.
TTS teknolojisinin temel "annesi" olan Dr. Nguyen Thi Thu Trang, Paris 11 Üniversitesi'ndeki doktora tezinden bu yana üzerinde büyük emek harcadığı Vietnam konuşma sentezi teknolojisinden elde edilen ürünleri gerçek kullanıcılarla buluşturmayı her zaman arzuluyor.
Vbee'nin ilk günleri zorlu geçti. İlk iki yıl ücretsiz olmasına rağmen, metinden sese (TTS) aracı yalnızca küçük bir kullanıcı kitlesine ulaşabildi. Ancak COVID-19, beklenmedik bir dönüm noktasına dönüştü.
Sosyal mesafe konusunda katı düzenlemelerle karşı karşıya kalan FE Credit, Momo, Viet Credit ve Sacombank gibi işletmeler binlerce müşteriye ulaşmanın yollarını bulmak zorundaydı. İşte tam da bu noktada Vbee'ye fırsat doğdu: Borç hatırlatmalarından otomatik yanıtlara kadar ürünleri anında en uygun çözüm haline geldi. O dönemde sanal asistanlar ve sanal çağrı merkezleri, Vbee'nin gelirinin %80'ine kadarını oluşturuyordu.
Pandemi sona erip dünya ekonomisi düşüşe geçtiğinde, Vbee yeni bir zorlukla karşı karşıya kaldı. Üretken yapay zeka (GenAI) dalgası ve dijital içerik trendleri, TTS aracını yeniden canlandırdı. Bugün, TikTok'tan YouTube'a, Facebook'a kadar Vbee'nin yapay zeka sesleri her yerde karşımıza çıkıyor.
"Şu anda çok sayıda TTS içeriği tarafımızca sağlanıyor," diye gururla paylaştı Bay Ho Minh Duc. Şu anda Vbee'nin gerçek kullanıcı sayısı 2 milyonu aştı ve bu sayı her ay %20 oranında istikrarlı bir şekilde artmaya devam ediyor.
Vbee 20'den fazla yüksek kaliteli kurumsal sesi eğitti ve özel sesleri de sayarsanız 200'den fazla farklı yapay zeka sesi yarattılar.
Yakın zamanda araştırılıp test edilen yeni ses transkripsiyon teknolojisiyle, yeni bir sesin eğitilmesi için iki yıl önce olduğu gibi 4 ila onlarca saat kayıt yerine artık yalnızca 3 dakikalık kayıtlı veriye ihtiyaç duyuluyor.
CEO Ho Minh Duc ve Baş Teknoloji Sorumlusu Nguyen Thi Thu Trang - Vbee Veri Çözümleri ve Hizmetleri Anonim Şirketi'nin iki kurucusu - Fotoğraf: NVCC
"Vietnamca'yı daha iyi anlıyoruz"
Konuşma sentezi teknolojisi yarışında CEO Ho Minh Duc, teknolojik inovasyon çabalarının giderek sınırlarına ulaşacağı bir zaman öngörüyor.
Ona göre Vbee, yalnızca Vietnamca konuşma işleme için temel teknoloji geliştirmekle kalmıyor, aynı zamanda Vietnam dilini tüm incelikleriyle, tonlarıyla ve yalnızca gerçek Vietnamlıların tam olarak anlayabileceği benzersiz kültürüyle derinlemesine anlayabilecek bir teknoloji sistemi de inşa ediyor.
Vietnam'da TTS pazarında lider olan Vbee'nin iki lideri, araçlarının Vietnamca için yapay zeka ses okuma standardı haline geldiğine inanıyor. Kullanıcılar, Vbee tarafından geliştirilen her sesin doğruluğunu takdir etmekle kalmıyor, aynı zamanda "duyguyu" da hissediyorlar.
Örneğin, Vietnamcada sadece "sokak" kelimesinin bölgeye göre "hèm", "kiệt", "xếc" gibi birçok farklı adı vardır; her kelimenin yapay zekanın anlaması gereken farklı bir nüansı vardır.
Bunu başarmak için Vbee, yapay zeka eğitimi için güçlü sunucu sistemlerine yatırım yapmanın yanı sıra örnek veri kümeleri toplamaya da büyük yatırımlar yaptı.
CEO Ho Minh Duc, "Yapay zekanın her bir bölgesel nüansı doğru bir şekilde anlayıp işlemesine yardımcı olmak için sayısız örnek seti oluşturmamız gerekiyordu ve işleme sunucusunun maliyeti de oldukça yüksekti" diye konuştu.
Dr. Nguyen Thi Thu Trang, Vietnamcanın kendine özgü tonlarını ve dilbilgisini çözümlemek için Vbee'nin temel TTS teknolojisini araştırarak 15 yılı aşkın bir süre geçirdi. Onun için ana dili, ifade nüanslarıyla dolu incelikli bir dünya.
"Vietnamca dilim çok karmaşık ve ilgi çekici, tonlamalar en zor nokta ve dünyadaki diğer birçok popüler dilden farklı. Dili ne kadar iyi anlarsam, modelim o kadar doğru olacak," diye açıkladı.
Vbee, teknoloji çağında entegre Vietnamca dil işleme yazılımlarıyla araç ve cihazların vazgeçilmez bir parçası olacağını giderek daha fazla iddia ediyor.
Vbee ekibi her kelimede, her seste sadece teknolojiyi araştırıp geliştirmekle kalmıyor, aynı zamanda yapay zeka seslerinde gerçek bir "Vietnam duygusu" yaratmaya çalışıyor.
Vbee adı, görme engelliler için "gözler" haline gelecek bir araç geliştirme isteğimden doğan "Vietnamlılar Gözleriniz Olsun" ifadesinin kısaltmasıdır. Ancak, birçok insanın görmekten çok dinlemeye yöneldiği mevcut geliştirme trendinde, Vbee'nin herkesin "gözleri" olacağına inanıyoruz.
Dr. Nguyen Thi Thu Trang (Hanoi Bilim ve Teknoloji Üniversitesi Bilişim Teknolojileri ve İletişim Fakültesi Öğretim Üyesi, Vbee Şirketi Kurucusu ve Teknoloji Direktörü)
Sesli kitap severlerin buluşması
Vbee, Dr. Nguyen Thi Thu Trang ile görme engelliler topluluğu arasındaki ilişkiden doğdu. Öğrencilik yıllarından beri, görme engellilere destek olmak amacıyla sesli kitap kaydetme ve Vietnamca bir okuma kitabı geliştirme çalışmalarına katılıyor.
Bu deneyimler, Vbee'nin öncülü olan Vietnamca okuma yazılımını geliştirmesine ilham verdi. 2018 yılında, Hanoi Bilim ve Teknoloji Üniversitesi'nde sınıf arkadaşı olan ve Socbay.com projesi ve sesli kitapların dijitalleştirilmesinde deneyime sahip Ho Minh Duc ile birlikte, Vietnam'da metinden sese dönüştürme alanında öncü olan Vbee'yi kurdu.
Vbee'nin Olağanüstü Başarıları
- Qualcomm Vietnam İnovasyon Yarışması 2024'ün birincilik ödülü
- Tuoi Tre Startup Ödülü 2023 Özel Ödülü
- Grab Venture Ignite 2020 Hızlandırıcı programında kazanan girişim
- 2018 Vietnam Yetenek Birincilik Ödülü, 2020 Vietnam Yetenek İkincilik Ödülü
- Bilgi ve İletişim Bakanlığı'nın 2025-2030 Ulusal Dijital Dönüşüm Programı kapsamında Vietnam Temel Teknolojisi Sertifikası
- Vietnam Dijital Medya Ödülü 2018 ve Vingroup Fonu 2019'da kazanan proje.
Bölgesel vizyon
Vbee, Vietnam pazarındaki yerini sağlamlaştırdıktan sonra Güneydoğu Asya'ya açılmayı hedefliyor ve 2026 yılına kadar TTS teknolojisini Laos, Tayland, Kamboçya ve Filipinler gibi ülkelere getirmeyi planlıyor.
Dr. Nguyen Thi Thu Trang'a göre, günümüzde teknolojinin hızla ilerlemesi ve çok dilli modellerin ortaya çıkması, diğer diller için TTS araçlarının geliştirilmesini kolaylaştıracak.
Şu anda Tayca, Çince ve İngilizce için konuşma teknolojileri üzerine araştırma yapıyor ve Vbee'nin uluslararası pazarda yeni adımlar atmasını sağlıyor.
[reklam_2]
Kaynak: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Yorum (0)