Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee та її зусилля щодо розширення можливостей в'єтнамської мови.

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Зайшовши до зони очікування аеропорту, серед метушливого натовпу людей, що поверталися з ділових поїздок, Хо Мін Дик на кілька секунд зупинився, почувши ніжний, знайомий жіночий голос, що читав оголошення на системі.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Співробітники Vbee працюють у штаб-квартирі компанії в Ханої - Фото: Надано компанією.

Він посміхнувся, відчуваючи полегшення та щастя, ніби возз'єднався з коханою людиною. Ця «кохана людина» була одним із 20 акторів озвучування зі штучним інтелектом, з якими Дюк та команда Vbee провели незліченну кількість днів і місяців роботи, вкладаючи душу в кожен нюанс звуку та ретельно опрацьовуючи кожен нюанс, щоб зробити його дедалі природнішим та схожішим на людину.

Тернистий шлях стартапів

Генеральний директор Хо Мін Дик та технічний директор Нгуєн Тхі Тху Транг – два засновники акціонерної компанії Vbee Data Services and Solutions – незліченну кількість разів відчували таку радість і гордість.

Вони знову зустрічали цих «особливих знайомих» за різних обставин: чисті голоси зі шкільних гучномовців, теплі тони в будівлях або професійні голоси з автоматизованих телефонних систем багатьох підприємств.

Творіння Vbee вже не є просто результатом алгоритмів та коду; вони справді входять у реальне життя, роблячи непомітний, але потужний внесок у багато галузей.

Від рецензій на книги та дубляжу фільмів до автоматизованих оголошень кол-центру, Vbee вдихнув нове життя в голосові технології.

Як «мати» цієї основної технології синтезу мовлення, докторка Нгуєн Тхі Тху Транг завжди прагнула донести продукти, отримані на основі технології синтезу мовлення в'єтнамською мовою – технології, в яку вона вкладала багато пристрасті з часів своєї докторської дисертації в Університеті Париж 11, – до реальних користувачів.

Перші дні Vbee були сповнені труднощів. Незважаючи на те, що перші два роки їхній інструмент перетворення тексту в мовлення (TTS) був безкоштовним, він приваблював лише невелику групу користувачів. Але потім COVID-19 несподівано став поворотним моментом.

Зіткнувшись із суворими правилами соціального дистанціювання, такі компанії, як FE Credit, Momo, Viet Credit, Sacombank тощо, мали знайти способи охопити тисячі клієнтів. Саме тоді Vbee отримала можливість: від нагадувань про борги до автоматичних відповідей їхній продукт швидко став оптимальним рішенням. У той час віртуальні помічники та агенти віртуального кол-центру приносили до 80% доходу Vbee.

Коли пандемія вщухла, а світова економіка занепала, Vbee зіткнулася з новим викликом. Хвиля генеративного штучного інтелекту (GenAI) та тренд цифрового контенту відродили інструмент TTS. Сьогодні, від TikTok до YouTube та Facebook, голоси штучного інтелекту Vbee лунають всюди.

«Значна частина поточного контенту для синтезу мовлення надається нами», – з гордістю поділився Хо Мін Дик. Наразі активна база користувачів Vbee перевищила 2 мільйони, і це число продовжує неухильно зростати на 20% щомісяця.

Vbee навчила понад 20 високоякісних голосів компанії, а якщо врахувати голоси, замовлені на замовлення, то вони створили понад 200 різних голосів зі штучним інтелектом.

Завдяки нещодавно дослідженій та запущеній для тестування новій технології транскрипції голосу, для навчання нового голосу тепер потрібно лише 3 хвилини запису даних, замість 4-10 годин запису, як це було два роки тому.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Генеральний директор Хо Мін Дик та технічний директор Нгуєн Тхі Тху Транг – два засновники акціонерного товариства Vbee Data Services and Solutions – Фото: надано компанією.

«У нас є перевага в розумінні в'єтнамської мови».

У гонці за технологією синтезу мовлення генеральний директор Хо Мін Дик бачить точку, коли зусилля в галузі інноваційних технологій поступово досягнуть своїх меж.

За його словами, Vbee не лише розробляє базову технологію обробки в'єтнамського мовлення, але й створює технологічну систему, здатну глибоко розуміти в'єтнамську мову – з усіма її тонкощами, тонами та унікальною культурою, яку можуть повністю осягнути лише справжні в'єтнамці.

Як провідна компанія на ринку синтезу мовлення у В'єтнамі, два керівники Vbee вважають, що їхній інструмент став еталоном для озвучування за допомогою штучного інтелекту в'єтнамською мовою. Користувачі не лише цінують точність, але й відчувають «емоції» в кожному голосі, розробленому Vbee.

Наприклад, у в'єтнамській мові навіть одне слово на кшталт «ngõ» (провулок) має багато різних назв залежно від регіону, таких як «hẻm», «kiệt» та «xẹc» — кожне слово має окремий нюанс, який має зрозуміти штучний інтелект.

Щоб досягти цього, Vbee значно інвестувала у збір зразків наборів даних, а також у потужну серверну систему для навчання штучного інтелекту.

«Щоб штучний інтелект міг розуміти та правильно обробляти інформацію з такими регіональними нюансами, нам довелося створити незліченну кількість наборів зразків, а вартість серверів обробки також була дуже високою», – поділився генеральний директор Хо Мін Дик.

Доктор Нгуєн Тхі Тху Транг присвятила понад 15 років дослідженню основної технології синтезу мовлення Vbee, щоб розшифрувати характерні тони та граматику в'єтнамської мови. Для неї рідна мова — це тонкий світ, повний виразних нюансів.

«В’єтнамська мова — дуже складна та цікава; тони є найскладнішим аспектом і відрізняються від багатьох інших поширених мов світу. Чим краще я розумію мову, тим точнішою буде моя модель», — пояснила вона.

Vbee поступово утверджується як невід'ємна частина інструментів та пристроїв, що інтегрують програмне забезпечення для обробки в'єтнамської мови в технологічну епоху.

У кожному слові та кожному голосі команда Vbee не лише досліджує та розробляє технології, але й прагне створити справжню «в'єтнамську емоцію» у своїх голосах, створених штучним інтелектом.

Назва Vbee – це абревіатура від «Vietnamese BE your Eyes» (В'єтнамською BE – твої очі), що виникла з мого початкового бажання створити інструмент, який би служив «очима» для людей з вадами зору. Однак у сучасному світі, що розвивається, де багато людей надають перевагу слуху над зором, ми вважаємо, що Vbee також стане «очима» для всіх.

Д-р Нгуєн Тхі Тху Транг (старший викладач Школи інформаційних технологій та комунікацій Ханойського університету науки і технологій, засновник і головний технічний директор компанії Vbee)

Зустріч шанувальників аудіокниг

Vbee народився завдяки глибокому зв'язку докторки Нгуєн Тхі Тху Транг зі спільнотою людей з вадами зору. З часів студентства вона займалася записом аудіокниг та розробкою систем перетворення тексту в мовлення в'єтнамською мовою для підтримки людей з вадами зору.

Цей досвід надихнув її на розробку програмного забезпечення для перетворення тексту в мовлення в'єтнамською мовою – попередника Vbee. У 2018 році вона разом зі своїм однокурсником Хо Мін Диком – студентом Ханойського університету науки і технологій, який має досвід роботи в проекті Socbay.com та оцифровуванні аудіокниг – заснувала Vbee, піонера в галузі перетворення тексту в мовлення у В'єтнамі.

Видатні досягнення Vbee

- Переможець першого призу конкурсу Qualcomm Vietnam Innovation Challenge 2024

- Спеціальний приз на конкурсі Youth Start-up Award 2023

- Стартап перемагає в акселераційній програмі Grab Venture Ignite 2020.

- Головний приз на церемонії вручення премії Vietnam Talent Awards 2018 року, другий приз на церемонії вручення премії Vietnam Talent Awards 2020 року.

- Сертифікована як ключова технологія В'єтнаму в Національній програмі цифрової трансформації 2025-2030 років Міністерства інформації та зв'язку.

- Проєкт отримав нагороду Vietnam Digital Media Award 2018 та нагороду Vingroup Funding Award 2019.

Регіональне бачення

Закріпившись на в'єтнамському ринку, Vbee прагне розширитися в Південно-Східній Азії, плануючи до 2026 року запровадити свою технологію TTS у таких країнах, як Лаос, Таїланд, Камбоджа та Філіппіни.

За словами доктора Нгуєн Тхі Тху Транга, швидкий розвиток технологій сьогодні, з появою багатомовних моделей, полегшить розробку інструментів синтезу мовлення (TS) для інших мов.

Наразі вона досліджує технології голосового зв'язку для тайської, китайської та англійської мов, що відкриває нові можливості для Vbee на міжнародному ринку.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. В'єтнамський стартап відзначено на Паризькому саміті зі штучного інтелекту

Enfarm, в'єтнамський стартап у сфері технологій штучного інтелекту для сільського господарства, є одним із чотирьох представників Азії серед 50 проектів, представлених на саміті AI Action Summit у Парижі, Франція, 10 та 11 лютого.



Джерело: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Коментар (0)

Залиште коментар, щоб поділитися своїми почуттями!

У тій самій темі

У тій самій категорії

Того ж автора

Спадщина

Фігура

Бізнеси

Поточні події

Політична система

Місцевий

Продукт

Happy Vietnam
людська взаємодія та зв'язок

людська взаємодія та зв'язок

Пишаюся В'єтнамом

Пишаюся В'єтнамом

Традиційні перегони на човнах відбулися з нагоди святкування 30 квітня, 50-ї річниці возз'єднання країни.

Традиційні перегони на човнах відбулися з нагоди святкування 30 квітня, 50-ї річниці возз'єднання країни.