Vietnam.vn - Nền tảng quảng bá Việt Nam

Độc lập - Tự do - Hạnh phúc

Vbee i wysiłek na rzecz uskrzydlenia języka wietnamskiego

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Wchodząc do poczekalni lotniska, pośród zgiełku ludzi wracających z podróży służbowej, Ho Minh Duc zatrzymał się na kilka sekund, gdy usłyszał znajomy, łagodny kobiecy głos odczytujący komunikat w systemie.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Pracownicy Vbee pracują w siedzibie firmy w Hanoi – zdjęcie: NVCC

Uśmiechnął się, czując ulgę i szczęście, jakby spotkał krewnego. Ten „krewny” był jednym z 20 głosów AI, z którymi Duc i zespół Vbee „jadali i spali” przez wiele dni i miesięcy, wkładając całe serce w każdą linię dźwiękową, dbając o każdy niuans głosu, aby był bardziej naturalny i przypominał człowieka.

Nierówny start

Nie wiem, ile razy dyrektor generalny Ho Minh Duc i dyrektor ds. technologii Nguyen Thi Thu Trang – dwoje założycieli Vbee Data Solutions and Services Joint Stock Company – doświadczyli tego uczucia radości i dumy.

Spotykali „wyjątkowych znajomych” w wielu różnych sytuacjach: wyraźne głosy w szkolnych systemach nagłośnieniowych, ciepłe głosy w budynkach lub profesjonalne głosy z automatycznych central telefonicznych wielu firm.

Pomysły Vbee nie są już wyłącznie wynikiem algorytmów i kodów, ale faktycznie wchodzą w życie, wnosząc cichy, ale znaczący wkład w wiele dziedzin.

Od wstępów do książek, przez dubbing filmów, aż po automatyczne komunikaty w centrach obsługi telefonicznej — Vbee tchnęło nowe życie w technologię głosową.

Jako „matka” technologii TTS, dr Nguyen Thi Thu Trang zawsze dąży do tego, aby produkty technologii syntezy mowy wietnamskiej – technologii, której poświęciła wiele wysiłku od czasu swojej pracy doktorskiej na Uniwersytecie Paris 11 – były dostępne dla prawdziwych użytkowników.

Początki Vbee były trudne. Pomimo tego, że przez pierwsze dwa lata było darmowe, narzędzie do zamiany tekstu na mowę (TTS) przyciągnęło jedynie niewielką grupę użytkowników. Jednak pandemia COVID-19 okazała się nieoczekiwanym punktem zwrotnym.

W obliczu surowych przepisów dotyczących dystansu społecznego firmy takie jak FE Credit, Momo, Viet Credit, Sacombank … musiały znaleźć sposoby na dotarcie do tysięcy klientów. To właśnie wtedy Vbee otrzymało szansę: od przypomnień o zaległościach po automatyczne odpowiedzi, ich produkty szybko stały się optymalnym rozwiązaniem. W tamtym czasie wirtualni asystenci i wirtualne centra obsługi telefonicznej generowały do ​​80% przychodów Vbee.

Kiedy pandemia minęła, a światowa gospodarka podupadła, Vbee stanęło przed nowym wyzwaniem. Fala generatywnej sztucznej inteligencji (GenAI) i trendów związanych z treściami cyfrowymi ożywiły narzędzie TTS. Dziś, od TikToka po YouTube i Facebooka, głosy sztucznej inteligencji Vbee słychać wszędzie.

„Dużo treści TTS jest dziś dostarczane przez nas” – z dumą powiedział pan Ho Minh Duc. Obecnie liczba rzeczywistych użytkowników Vbee przekroczyła 2 miliony i stale rośnie o 20% miesięcznie.

Vbee wyszkoliło ponad 20 wysokiej jakości głosów korporacyjnych, a jeśli liczyć głosy niestandardowe, stworzyli ponad 200 różnych głosów AI.

Dzięki nowej technologii transkrypcji głosu, która została niedawno przebadana i przetestowana, do wyszkolenia nowego głosu potrzeba obecnie zaledwie 3 minut nagranych danych, podczas gdy dwa lata temu potrzeba było od 4 do kilkudziesięciu godzin nagrania.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Dyrektor generalny Ho Minh Duc i dyrektor ds. technologii Nguyen Thi Thu Trang – dwaj założyciele Vbee Data Solutions and Services Joint Stock Company – Zdjęcie: NVCC

„Lepiej rozumiemy język wietnamski”

W wyścigu o technologię syntezy mowy dyrektor generalny Ho Minh Duc przewiduje, że nadejdzie czas, w którym wysiłki na rzecz innowacji technologicznych stopniowo osiągną swoje granice.

Według niego Vbee nie tylko opracowuje podstawową technologię przetwarzania mowy wietnamskiej, ale także buduje system technologiczny zdolny do głębokiego rozumienia języka wietnamskiego – ze wszystkimi niuansami, tonami i wyjątkową kulturą, którą w pełni rozumieją tylko prawdziwi Wietnamczycy.

Jako lider na rynku syntezatorów mowy w Wietnamie, Vbee, jako lider, wierzy, że ich narzędzie stało się standardem w zakresie odczytywania głosu przez sztuczną inteligencję w języku wietnamskim. Użytkownicy nie tylko doceniają dokładność, ale także odczuwają „emocje” w każdym głosie opracowanym przez Vbee.

Na przykład w języku wietnamskim jedno słowo „alley” ma wiele różnych nazw w zależności od regionu, takich jak „hem”, „kiem”, „xec” — każde słowo ma inne znaczenie, które sztuczna inteligencja musi zrozumieć.

Aby to osiągnąć, Vbee zainwestowało znaczne środki w zbieranie próbek danych, a także w wydajne systemy serwerowe do szkolenia sztucznej inteligencji.

„Aby pomóc sztucznej inteligencji zrozumieć i prawidłowo przetworzyć każdy regionalny niuans, musieliśmy stworzyć niezliczoną ilość zestawów próbek, a koszt serwera przetwarzającego był również bardzo wysoki” – powiedział dyrektor generalny Ho Minh Duc.

Dr Nguyen Thi Thu Trang poświęciła ponad 15 lat na badanie technologii syntezy mowy (TTS) Vbee, aby dekodować unikalne tony i gramatykę języka wietnamskiego. Dla niej język ojczysty to subtelny świat pełen ekspresyjnych niuansów.

„Mój język wietnamski jest bardzo złożony i interesujący, tony stanowią najtrudniejszy punkt i różnią się od wielu innych popularnych języków na świecie. Im lepiej rozumiem ten język, tym dokładniejszy będzie mój model” – wyjaśniła.

Vbee stopniowo przekonuje, że stanie się nieodzowną częścią narzędzi i urządzeń ze zintegrowanym oprogramowaniem do przetwarzania języka wietnamskiego w erze technologii.

W każdym słowie, w każdym głosie zespół Vbee nie tylko bada i rozwija technologię, ale także dąży do tego, aby w głosach sztucznej inteligencji wywołać prawdziwie „wietnamskie emocje”.

Nazwa Vbee to skrót od zwrotu „Vietnamese BE your Eyes”, który wywodzi się z mojego pierwotnego pragnienia stworzenia narzędzia, które stanie się „oczami” dla osób z dysfunkcją wzroku. Jednak w obecnym trendzie rozwojowym, kiedy wiele osób chce skupić się bardziej na słuchaniu niż na patrzeniu, wierzymy, że Vbee stanie się również „oczami” każdego.

Dr Nguyen Thi Thu Trang (wykładowca Wydziału Technologii Informacyjnych i Komunikacji Uniwersytetu Naukowo-Technicznego w Hanoi, założyciel i dyrektor ds. technologii w firmie Vbee)

Spotkanie miłośników audiobooków

Vbee powstało z relacji dr Nguyen Thi Thu Trang ze społecznością osób niewidomych. Od czasów studenckich uczestniczyła w nagrywaniu audiobooków i rozwijaniu wietnamskiego lektora, aby wspierać osoby niewidome.

Te doświadczenia zainspirowały ją do stworzenia wietnamskiego oprogramowania do czytania – poprzednika Vbee. W 2018 roku wraz z panem Ho Minh Ducem – kolegą ze studiów na Uniwersytecie Nauki i Technologii w Hanoi, który ma doświadczenie w projekcie Socbay.com i digitalizacji audiobooków – założyła Vbee, pioniera w dziedzinie zamiany tekstu na mowę w Wietnamie.

Wybitne osiągnięcia Vbee

- Pierwsza nagroda w konkursie Qualcomm Vietnam Innovation Challenge 2024

- Nagroda Specjalna Tuoi Tre Start-up Award 2023

- Zwycięski startup w programie akceleracyjnym Grab Venture Ignite 2020 Startup Acceleration Program

- Pierwsza nagroda Wietnamskiego Talentu 2018, druga nagroda Wietnamskiego Talentu 2020

- Certyfikat wietnamskiej technologii podstawowej w Narodowym Programie Transformacji Cyfrowej 2025-2030 Ministerstwa Informacji i Komunikacji

- Zwycięski projekt w Vietnam Digital Media Award 2018 i Vingroup Fund 2019.

Wizja regionalna

Po ugruntowaniu swojej pozycji na rynku wietnamskim firma Vbee planuje ekspansję na rynek Azji Południowo-Wschodniej i do 2026 roku planuje wprowadzić swoją technologię TTS do takich krajów jak Laos, Tajlandia, Kambodża i Filipiny.

Zdaniem dr Nguyen Thi Thu Trang szybki postęp technologiczny i pojawienie się modeli wielojęzycznych ułatwią opracowywanie narzędzi TTS dla innych języków.

Obecnie prowadzi badania nad technologiami mowy dla języków tajskiego, chińskiego i angielskiego, co otwiera nowe możliwości dla Vbee na rynku międzynarodowym.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Wietnamski startup wyróżniony na szczycie AI w Paryżu

Enfarm, startup zajmujący się technologią sztucznej inteligencji (AI) dla wietnamskiego rolnictwa, jest jednym z czterech przedstawicieli Azji wśród 50 projektów zaprezentowanych na szczycie AI Action Summit w Paryżu (Francja), który odbył się 10 i 11 lutego.



Źródło: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Komentarz (0)

No data
No data

W tym samym temacie

W tej samej kategorii

Wieś w Da Nang w pierwszej pięćdziesiątce najpiękniejszych wiosek na świecie w 2025 roku
Wioska zajmująca się wyrobem lampionów jest zalewana zamówieniami w czasie Święta Środka Jesieni; zamówienia są realizowane natychmiast po ich złożeniu.
Niepewnie huśtając się na klifie, trzymając się skał, aby zeskrobać dżem z wodorostów na plaży Gia Lai
48 godzin polowania na chmury, obserwowania pól ryżowych i jedzenia kurczaków w Y Ty

Od tego samego autora

Dziedzictwo

Postać

Biznes

No videos available

Aktualności

System polityczny

Lokalny

Produkt