Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee i jego wysiłki na rzecz wzmocnienia języka wietnamskiego.

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Wchodząc do poczekalni lotniska, pośród tłumu ludzi powracających z podróży służbowych, Ho Minh Duc zatrzymał się na kilka sekund, gdy usłyszał delikatny, znajomy kobiecy głos odczytujący komunikat w systemie.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Pracownicy Vbee pracują w siedzibie firmy w Hanoi. Zdjęcie: Dostarczone przez firmę.

Uśmiechnął się, czując ulgę i szczęście, jakby ponownie spotkał się z ukochaną osobą. Ta „ukochana osoba” była jedną z 20 aktorów głosowych AI, z którymi Duc i zespół Vbee spędzili niezliczone dni i miesiące, pracując z nimi, wkładając całe serce w każdy niuans dźwięku i starannie dopracowując każdy z nich, aby były coraz bardziej naturalne i ludzkie.

Wyboista droga start-upów

Dyrektor generalny Ho Minh Duc i dyrektor ds. technologii Nguyen Thi Thu Trang – dwaj założyciele Vbee Data Services and Solutions Joint Stock Company – doświadczyli takiej radości i dumy niezliczoną ilość razy.

Spotykali tych „wyjątkowych znajomych” ponownie w różnych okolicznościach: wyraźne głosy dochodzące z głośników szkolnych, ciepłe tony w budynkach czy profesjonalne głosy z automatycznych systemów telefonicznych wielu przedsiębiorstw.

Dzieła Vbee nie są już wyłącznie wynikiem algorytmów i kodu; wkraczają one naprawdę w życie, wnosząc cichy, ale istotny wkład w wiele dziedzin.

Od recenzji książek i dubbingu filmów po zautomatyzowane komunikaty w call center — Vbee tchnęło nowe życie w technologię głosową.

Jako „matka” tej kluczowej technologii TTS, dr Nguyen Thi Thu Trang zawsze dążyła do tego, aby produkty wywodzące się z wietnamskiej technologii syntezy mowy – technologii, w którą wkładała wiele pasji od czasu swojej pracy doktorskiej na Uniwersytecie Paris 11 – były dostępne dla prawdziwych użytkowników.

Początki Vbee były pełne wyzwań. Pomimo tego, że przez pierwsze dwa lata było darmowe, ich narzędzie do zamiany tekstu na mowę (TTS) przyciągnęło jedynie niewielką grupę użytkowników. Jednak niespodziewanie pandemia COVID-19 stała się punktem zwrotnym.

W obliczu surowych przepisów dotyczących dystansu społecznego firmy takie jak FE Credit, Momo, Viet Credit, Sacombank itp. musiały znaleźć sposoby na dotarcie do tysięcy klientów. To właśnie wtedy Vbee otrzymało szansę: od przypomnień o długach po automatyczne odpowiedzi, ich produkt szybko stał się optymalnym rozwiązaniem. W tamtym czasie wirtualni asystenci i wirtualni agenci call center generowali do 80% przychodów Vbee.

Wraz z ustąpieniem pandemii i pogorszeniem się sytuacji gospodarczej na świecie, Vbee stanęło przed nowym wyzwaniem. Fala generatywnej sztucznej inteligencji (GenAI) i trend treści cyfrowych ożywiły narzędzie TTS. Dziś, od TikToka po YouTube i Facebooka, głosy sztucznej inteligencji Vbee są wszędzie.

„Wiele z obecnych treści TTS jest dostarczanych przez nas” – z dumą powiedział Ho Minh Duc. Obecnie baza aktywnych użytkowników Vbee przekroczyła 2 miliony i liczba ta stale rośnie o 20% miesięcznie.

Vbee wyszkoliło ponad 20 wysokiej jakości głosów firmowych, a jeśli dodamy głosy zamawiane niestandardowo, stworzyli ponad 200 różnych głosów sztucznej inteligencji.

Dzięki niedawno opracowanym i przetestowanym rozwiązaniom w zakresie technologii transkrypcji głosu, nowy głos wymaga obecnie jedynie 3 minut nagrania danych w celu jego wyszkolenia, podczas gdy dwa lata temu wymagało to od 4 do 10 godzin nagrania.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Dyrektor generalny Ho Minh Duc i dyrektor ds. technicznych Nguyen Thi Thu Trang – dwaj założyciele Vbee Data Services and Solutions Joint Stock Company – Zdjęcie: Dostarczone przez firmę.

„Mamy przewagę w znajomości języka wietnamskiego”.

W wyścigu o technologię syntezy mowy dyrektor generalny Ho Minh Duc dostrzega moment, w którym wysiłki na rzecz innowacji technologicznych stopniowo osiągną swoje granice.

Według niego Vbee nie tylko opracowuje podstawową technologię przetwarzania mowy wietnamskiej, ale także buduje system technologiczny zdolny do głębokiego zrozumienia języka wietnamskiego – ze wszystkimi jego subtelnościami, tonami i wyjątkową kulturą, którą w pełni rozumieją tylko prawdziwi Wietnamczycy.

Jako wiodąca firma na rynku syntezatorów mowy w Wietnamie, Vbee, dwóch liderów, wierzy, że ich narzędzie stało się punktem odniesienia dla sztucznej inteligencji w zakresie lektorów w języku wietnamskim. Użytkownicy nie tylko doceniają dokładność, ale także wyczuwają „emocje” w każdym głosie opracowanym przez Vbee.

Na przykład w języku wietnamskim nawet pojedyncze słowo, takie jak „ngõ” (zaułek), ma wiele różnych nazw w zależności od regionu, takich jak „hẻm”, „kiệt” i „xẹc” — każde słowo niesie ze sobą odrębny niuans, który sztuczna inteligencja musi zrozumieć.

Aby to osiągnąć, Vbee zainwestowało znaczne środki w zbieranie próbek danych, a także w wydajny system serwerowy do szkolenia sztucznej inteligencji.

„Aby umożliwić sztucznej inteligencji zrozumienie i prawidłowe przetwarzanie informacji uwzględniających tak regionalne niuanse, musieliśmy stworzyć niezliczoną ilość zestawów próbek, a koszt serwerów przetwarzających był bardzo wysoki” – powiedział dyrektor generalny Ho Minh Duc.

Dr Nguyen Thi Thu Trang poświęciła ponad 15 lat badaniom nad technologią syntezy mowy Vbee, aby rozszyfrować charakterystyczne tony i gramatykę języka wietnamskiego. Dla niej język ojczysty to subtelny świat pełen ekspresyjnych niuansów.

„Język wietnamski jest bardzo złożony i interesujący; tony stanowią najtrudniejszy aspekt i różnią się od wielu innych popularnych języków na świecie. Im lepiej rozumiem ten język, tym dokładniejszy będzie mój model” – wyjaśniła.

Vbee stopniowo staje się nieodzownym elementem narzędzi i urządzeń integrujących oprogramowanie do przetwarzania języka wietnamskiego w erze technologicznej.

W każdym słowie i każdym głosie zespół Vbee nie tylko bada i rozwija technologię, ale także dąży do wytworzenia autentycznej „wietnamskiej emocji” w głosie sztucznej inteligencji.

Nazwa Vbee to skrót od wietnamskiego „BE your Eyes” (Bądź swoimi oczami), zrodzony z mojego pierwotnego pragnienia stworzenia narzędzia, które będzie służyć jako „oczy” dla osób z dysfunkcją wzroku. Jednak w dzisiejszym rozwijającym się świecie, gdzie wiele osób przedkłada słuch nad wzrok, wierzymy, że Vbee stanie się również „oczami” dla każdego.

Dr Nguyen Thi Thu Trang (starszy wykładowca w Szkole Technologii Informacyjnych i Komunikacji Uniwersytetu Naukowo-Technicznego w Hanoi, założyciel i dyrektor ds. technologii w firmie Vbee)

Spotkanie miłośników audiobooków

Vbee powstało z głębokiej więzi dr Nguyen Thi Thu Trang ze społecznością osób z dysfunkcją wzroku. Od czasów studenckich zajmowała się nagrywaniem audiobooków i rozwojem wietnamskich systemów zamiany tekstu na mowę, aby wspierać osoby z dysfunkcją wzroku.

Te doświadczenia zainspirowały ją do stworzenia wietnamskiego oprogramowania do zamiany tekstu na mowę – prekursora Vbee. W 2018 roku wraz ze swoim kolegą z roku, Ho Minh Duc – studentem Uniwersytetu Nauki i Technologii w Hanoi, który ma doświadczenie w projekcie Socbay.com i digitalizacji audiobooków – założyła Vbee, pioniera w dziedzinie zamiany tekstu na mowę w Wietnamie.

Wybitne osiągnięcia Vbee

- Zdobywca pierwszej nagrody w konkursie Qualcomm Vietnam Innovation Challenge 2024

- Nagroda Specjalna w konkursie Youth Start-up Award 2023

- Startup wygrywa program akceleracyjny Grab Venture Ignite 2020.

- Główna nagroda w konkursie Vietnam Talent Awards 2018, druga nagroda w konkursie Vietnam Talent Awards 2020.

- Certyfikowana jako wietnamska technologia podstawowa w Narodowym Programie Transformacji Cyfrowej 2025-2030 Ministerstwa Informacji i Komunikacji.

- Projekt zdobył nagrodę Vietnam Digital Media Award 2018 oraz nagrodę Vingroup Funding Award 2019.

Wizja regionalna

Po ugruntowaniu swojej pozycji na rynku wietnamskim firma Vbee planuje ekspansję na rynek Azji Południowo-Wschodniej i do 2026 roku planuje wprowadzić swoją technologię TTS do takich krajów jak Laos, Tajlandia, Kambodża i Filipiny.

Zdaniem dr Nguyen Thi Thu Trang szybki postęp technologiczny i pojawienie się modeli wielojęzycznych sprawią, że opracowywanie narzędzi TTS dla innych języków stanie się łatwiejsze.

Obecnie prowadzi badania nad technologiami głosowymi dla języków tajskiego, chińskiego i angielskiego, co otwiera nowe możliwości dla Vbee na rynku międzynarodowym.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Wietnamski startup wyróżniony na paryskim szczycie AI

Enfarm, wietnamski startup zajmujący się technologią sztucznej inteligencji w rolnictwie, jest jednym z czterech przedstawicieli Azji wśród 50 projektów zaprezentowanych na szczycie AI Action Summit w Paryżu we Francji, który odbył się 10 i 11 lutego.



Źródło: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Komentarz (0)

Zostaw komentarz, aby podzielić się swoimi odczuciami!

W tym samym temacie

W tej samej kategorii

Od tego samego autora

Dziedzictwo

Postać

Firmy

Sprawy bieżące

System polityczny

Lokalny

Produkt

Happy Vietnam
uśmiech

uśmiech

Szczęście pod wschodem słońca

Szczęście pod wschodem słońca

O, moja ojczyzno!

O, moja ojczyzno!