Intrând în sala de așteptare a aeroportului, în mijlocul agitației oamenilor care se întorceau dintr-o călătorie de afaceri, Ho Minh Duc s-a oprit câteva secunde când a auzit o voce feminină familiară și blândă care citise un anunț în sistem.
Angajații Vbee lucrează la sediul companiei din Hanoi - Foto: NVCC
A zâmbit, simțindu-se ușurat și fericit ca și cum ar fi întâlnit o rudă. Acea „rudă” era una dintre cele 20 de voci de inteligență artificială cu care Duc și echipa Vbee „mâncaseră și dormiseră” timp de multe zile și luni, revărsându-și toată inima în fiecare linie sonoră, având grijă de fiecare nuanță a vocii pentru a o face mai naturală și mai umană.
Pornire dificilă
Nu știu de câte ori CEO-ul Ho Minh Duc și CTO-ul Nguyen Thi Thu Trang - cei doi fondatori ai Vbee Data Solutions and Services Joint Stock Company - au experimentat un asemenea sentiment de bucurie și mândrie.
Au întâlnit „cunoștințe speciale” în multe situații diferite: voci clare la difuzoarele școlilor, voci calde în clădiri sau voci profesionale din tablourile automate ale multor companii.
Creațiile Vbee nu mai sunt doar rezultatul unor algoritmi și coduri, ci chiar intră în viață, aducând contribuții silențioase, dar puternice, în multe domenii.
De la prezentări de cărți, dublaj de filme până la anunțuri automate în centrele de apeluri, Vbee a insuflat o nouă viață tehnologiei vocale.
În calitate de „mamă” a tehnologiei TTS de bază, Dr. Nguyen Thi Thu Trang aspiră întotdeauna să aducă produse din tehnologia vietnameză de sinteză vocală - tehnologia căreia i-a dedicat mult efort încă de la teza sa de doctorat la Universitatea Paris 11 - utilizatorilor reali.
Primele zile ale Vbee au fost dificile. Deși a fost gratuit în primii doi ani, instrumentul său de conversie a vorbirii prin text (TTS) a atras doar un grup mic de utilizatori. Dar apoi, COVID-19 s-a transformat într-un punct de cotitură neașteptat.
Confruntate cu reglementări stricte privind distanțarea socială, companii precum FE Credit, Momo, Viet Credit, Sacombank ... au fost nevoite să găsească modalități de a ajunge la mii de clienți. Atunci Vbee a primit oportunitatea: de la notificări de datorii la răspunsuri automate, produsele lor au devenit prompt soluția optimă. La acea vreme, asistenții virtuali și centrele de apel virtuale aduceau până la 80% din veniturile Vbee.
Când pandemia a trecut și economia mondială a intrat în declin, Vbee s-a confruntat cu o nouă provocare. Valul de inteligență artificială generativă (GenAI) și tendințele conținutului digital au reînviat instrumentul TTS. Astăzi, de la TikTok la YouTube, Facebook, vocile AI ale Vbee apar peste tot.
„O mare parte din conținutul TTS de astăzi este furnizat de noi”, a declarat cu mândrie dl. Ho Minh Duc. În prezent, numărul utilizatorilor reali ai Vbee a depășit 2 milioane, iar acest număr continuă să crească constant cu 20% în fiecare lună.
Vbee a antrenat peste 20 de voci corporative de înaltă calitate, iar dacă numărăm vocile personalizate, au creat peste 200 de voci diferite de inteligență artificială.
Cu noua tehnologie de transcriere vocală, recent cercetată și testată, o voce nouă are nevoie acum de doar 3 minute de date înregistrate pentru antrenare, în loc de 4 până la zeci de ore de înregistrare, cum era acum doi ani.
Directorul general Ho Minh Duc și directorul tehnic Nguyen Thi Thu Trang - doi fondatori ai companiei pe acțiuni Vbee Data Solutions and Services - Fotografie: NVCC
„Înțelegem mai bine limba vietnameză”
În cursa pentru tehnologia de sinteză vocală, CEO-ul Ho Minh Duc vede o perioadă în care eforturile de inovare tehnologică își vor atinge treptat limitele.
Potrivit acestuia, Vbee nu numai că dezvoltă tehnologie de bază pentru procesarea vorbirii în limba vietnameză, dar construiește și un sistem tehnologic capabil să înțeleagă în profunzime limba vietnameză - cu toate subtilitățile, tonurile și cultura unică pe care doar vietnamezii adevărați le pot înțelege pe deplin.
În calitate de lider pe piața TTS din Vietnam, cei doi lideri ai Vbee consideră că instrumentul lor a devenit standardul pentru citirea vocală prin inteligență artificială pentru limbajul vietnamez. Utilizatorii nu numai că apreciază acuratețea, dar simt și „emoția” din fiecare voce dezvoltată de Vbee.
În limba vietnameză, de exemplu, un singur cuvânt, „alee”, are multe denumiri diferite în funcție de regiune, cum ar fi „hem”, „kiem”, „xec” - fiecare cuvânt are o nuanță diferită pe care inteligența artificială trebuie să o înțeleagă.
Pentru a realiza acest lucru, Vbee a investit masiv în colectarea de seturi de date eșantion, precum și în sisteme de servere puternice pentru antrenamentul în domeniul inteligenței artificiale.
„Pentru a ajuta inteligența artificială să înțeleagă și să proceseze corect fiecare nuanță regională, a trebuit să construim nenumărate seturi de mostre, iar costul serverului de procesare a fost, de asemenea, foarte mare”, a declarat CEO-ul Ho Minh Duc.
Dr. Nguyen Thi Thu Trang a petrecut peste 15 ani cercetând tehnologia TTS de bază a Vbee pentru a decodifica tonurile și gramatica unice ale limbii vietnameze. Pentru ea, limba maternă este o lume subtilă plină de nuanțe expresive.
„Limba mea vietnameză este foarte complexă și interesantă, tonurile sunt cel mai dificil punct și diferite de multe alte limbi populare din lume. Cu cât înțeleg mai bine limba, cu atât modelul meu va fi mai precis”, a explicat ea.
Vbee afirmă treptat că va fi o parte indispensabilă a instrumentelor și dispozitivelor cu software integrat de procesare a limbii vietnameze în era tehnologiei.
În fiecare cuvânt, în fiecare voce, echipa Vbee nu numai că cercetează și dezvoltă tehnologie, dar se străduiește și să creeze o adevărată „emoție vietnameză” în vocile lor bazate pe inteligență artificială.
Numele Vbee este o abreviere a sintagmei „Vietnamese BE your Eyes” (Vietnam, fii ochii tăi), care provine din dorința mea inițială de a construi un instrument care să devină „ochii” pentru persoanele cu deficiențe de vedere. Însă, în tendința actuală de dezvoltare, când mulți oameni vor să treacă la ascultare mai mult decât la vedere, credem că Vbee va deveni și „ochii” tuturor.
Dr. Nguyen Thi Thu Trang (lector universitar la Școala de Tehnologia Informației și Comunicațiilor, Universitatea de Știință și Tehnologie din Hanoi, fondatoare și director tehnic al companiei Vbee)
Întâlnire a pasionaților de cărți audio
Vbee s-a născut din relația dintre Dr. Nguyen Thi Thu Trang și comunitatea nevăzătorilor. Încă din perioada studenției, a participat la înregistrarea de cărți audio și la dezvoltarea unui cititor vietnamez pentru a sprijini nevăzătorii.
Aceste experiențe au inspirat-o să dezvolte un software de citire a limbii vietnameze - predecesorul Vbee. În 2018, ea și domnul Ho Minh Duc - un coleg de clasă la Universitatea de Știință și Tehnologie din Hanoi cu experiență în proiectul Socbay.com și în digitalizarea cărților audio - au fondat Vbee, un pionier în domeniul textului în vorbire în Vietnam.
Realizările remarcabile ale Vbee
- Premiul I al Competiției de Inovație Qualcomm Vietnam 2024
- Premiul Special al Premiului Tuoi Tre pentru Startup-uri 2023
- Startup câștigător în cadrul programului de accelerare a startup-urilor Grab Venture Ignite 2020
- Premiul I al Concursului Vietnamez Talent 2018, premiul II al Concursului Vietnamez Talent 2020
- Certificat de Tehnologie de Bază Vietnameză în cadrul Programului Național de Transformare Digitală 2025 - 2030 al Ministerului Informațiilor și Comunicațiilor
- Proiect câștigător la Premiul Vietnam Digital Media 2018 și la Fondul Vingroup 2019.
Viziunea regională
După ce și-a afirmat poziția pe piața vietnameză, Vbee își propune să se extindă în Asia de Sud-Est, cu planuri de a aduce tehnologia sa TTS în țări precum Laos, Thailanda, Cambodgia și Filipine până în 2026.
Potrivit Dr. Nguyen Thi Thu Trang, avansul rapid al tehnologiei de astăzi, odată cu apariția modelelor multilingve, va facilita dezvoltarea de instrumente TTS pentru alte limbi.
În prezent, ea cercetează tehnologii de vorbire pentru limbile thailandeză, chineză și engleză, deschizând noi pași pentru Vbee pe piața internațională.
Sursă: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm
Comentariu (0)