Vietnam.vn - Nền tảng quảng bá Việt Nam

Vbee та зусилля, спрямовані на розвиток в'єтнамської мови

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Заходячи до зали очікування аеропорту, серед метушні людей, які поверталися з відрядження, Хо Мін Дик на кілька секунд зупинився, почувши знайомий, ніжний жіночий голос, що читав оголошення на системі.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Співробітники Vbee працюють у штаб-квартирі компанії в Ханої - Фото: NVCC

Він посміхнувся, відчуваючи полегшення та радість, ніби зустрів родича. Цей «родич» був одним із 20 голосів штучного інтелекту, з якими Дюк та команда Vbee «їли та спали» протягом багатьох днів і місяців, вкладаючи всю свою душу в кожну звукову лінію, піклуючись про кожен нюанс голосу, щоб зробити їх більш природними та схожими на людину.

Невдалий запуск

Я не знаю, скільки разів генеральний директор Хо Мін Дик та технічний директор Нгуєн Тхі Тху Транг – два засновники акціонерної компанії Vbee Data Solutions and Services – відчували таке почуття радості та гордості.

Вони зустрічали «особливих знайомих» у багатьох різних ситуаціях: чисті голоси зі шкільних гучномовців, теплі голоси в будівлях або професійні голоси з автоматичних комутаторів багатьох підприємств.

Розробки Vbee вже не є просто результатом алгоритмів та кодів, а фактично входять у життя, роблячи тихий, але потужний внесок у багато галузей.

Від оголошень про книги та дубляжу фільмів до автоматизованих оголошень кол-центру, Vbee вдихнув нове життя в голосові технології.

Як «мати» основної технології синтезу мовлення, докторка Нгуєн Тхі Тху Транг завжди прагне донести продукти технології синтезу мовлення в'єтнамською мовою – технології, якій вона присвятила багато зусиль з моменту написання докторської дисертації в Університеті Париж 11 – до реальних користувачів.

Перші дні Vbee були складними. Незважаючи на те, що перші два роки він був безкоштовним, його інструмент перетворення тексту в мовлення (TTS) приваблював лише невелику групу користувачів. Але потім COVID-19 став неочікуваним поворотним моментом.

Зіткнувшись із суворими правилами соціального дистанціювання, такі компанії, як FE Credit, Momo, Viet Credit, Sacombank ... мали знайти способи охопити тисячі клієнтів. Саме тоді Vbee отримала можливість: від нагадувань про борги до автоматичних відповідей, їхні продукти швидко стали оптимальним рішенням. У той час віртуальні помічники та віртуальні кол-центри приносили до 80% доходу Vbee.

Коли пандемія минула, а світова економіка занепала, Vbee зіткнулася з новим викликом. Хвиля генеративного штучного інтелекту (GenAI) та тенденцій цифрового контенту відродила інструмент TTS. Сьогодні, від TikTok до YouTube та Facebook, голоси Vbee зі штучним інтелектом лунають всюди.

«Багато контенту для синтезу мовлення сьогодні надаємо ми», – з гордістю поділився пан Хо Мін Дик. Наразі кількість фактичних користувачів Vbee перевищила 2 мільйони, і це число продовжує неухильно зростати на 20% щомісяця.

Vbee навчила понад 20 високоякісних корпоративних голосів, а якщо врахувати користувацькі голоси, то вони створили понад 200 різних голосів зі штучним інтелектом.

Завдяки новій технології транскрипції голосу, яка нещодавно була досліджена та протестована, для навчання нового голосу тепер потрібно лише 3 хвилини записаних даних замість 4-х або десятків годин запису, як два роки тому.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Генеральний директор Хо Мін Дик та головний технічний директор Нгуєн Тхі Тху Транг – два засновники акціонерного товариства Vbee Data Solutions and Services – Фото: NVCC

«Ми краще розуміємо в'єтнамську мову»

У гонці за технологією синтезу мовлення генеральний директор Хо Мін Дик бачить час, коли зусилля в галузі технологічних інновацій поступово досягнуть своїх меж.

За його словами, Vbee не лише розробляє базову технологію для обробки в'єтнамського мовлення, але й створює технологічну систему, здатну глибоко розуміти в'єтнамську мову — з усіма тонкощами, тонами та унікальною культурою, яку можуть повністю зрозуміти лише справжні в'єтнамці.

Як лідер на ринку синтезу мовлення у В'єтнамі, два керівники Vbee вважають, що їхній інструмент став стандартом для читання голосу за допомогою штучного інтелекту для в'єтнамців. Користувачі не лише цінують точність, але й відчувають «емоції» в кожному голосі, розробленому Vbee.

Наприклад, у в'єтнамській мові одне слово «алея» має багато різних назв залежно від регіону, таких як «хем», «кіем», «ксек» – кожне слово має різний нюанс, який має зрозуміти штучний інтелект.

Щоб досягти цього, Vbee значно інвестувала у збір зразків наборів даних, а також у потужні серверні системи для навчання штучного інтелекту.

«Щоб допомогти штучному інтелекту зрозуміти та правильно обробити кожен регіональний нюанс, нам довелося створити незліченну кількість наборів зразків, а вартість сервера обробки також була дуже високою», – поділився генеральний директор Хо Мін Дик.

Доктор Нгуєн Тхі Тху Транг понад 15 років досліджувала основну технологію синтезу мовлення Vbee для розшифровки унікальних тонів та граматики в'єтнамської мови. Для неї рідна мова — це тонкий світ, повний виразних нюансів.

«Моя в’єтнамська мова дуже складна та цікава, тони є найскладнішим моментом і відрізняються від багатьох інших популярних мов світу. Чим краще я розумію мову, тим точнішою буде моя модель», – пояснила вона.

Vbee поступово стверджує, що вони стануть невід'ємною частиною інструментів та пристроїв з інтегрованим програмним забезпеченням для обробки в'єтнамської мови в еру технологій.

У кожному слові, кожному голосі команда Vbee не лише досліджує та розробляє технології, але й прагне створити справді «в'єтнамську емоцію» у своїх голосах, створених за допомогою штучного інтелекту.

Назва Vbee – це скорочення від фрази «Vietnamese BE your Eyes» (В'єтнамці – ваші очі), яка походить від мого початкового бажання створити інструмент, який стане «очима» для людей з вадами зору. Але в сучасних тенденціях розвитку, коли багато людей хочуть перейти на слух більше, ніж на зір, ми вважаємо, що Vbee також стане «очима» кожного.

Д-р Нгуєн Тхі Тху Транг (викладач Школи інформаційних технологій та комунікацій Ханойського університету науки і технологій, засновник і директор з технологій компанії Vbee)

Зустріч шанувальників аудіокниг

Vbee народилася завдяки співпраці між докторкою Нгуєн Тхі Тху Транг та спільнотою незрячих. Зі студентських років вона брала участь у записі аудіокниг та розробці в'єтнамської читалки для підтримки незрячих.

Цей досвід надихнув її на розробку програмного забезпечення для читання в'єтнамською мовою – попередника Vbee. У 2018 році вона разом із паном Хо Мін Диком – однокурсником Ханойського університету науки і технологій, який має досвід роботи в проекті Socbay.com та оцифрування аудіокниг – заснували Vbee, піонера в галузі перетворення тексту в мовлення у В'єтнамі.

Видатні досягнення Vbee

- Перший приз у конкурсі Qualcomm Vietnam Innovation Challenge 2024

- Спеціальний приз від Tuoi Tre Start-up Award 2023

- Стартап-переможець програми акселерації стартапів Grab Venture Ignite 2020

- Перший приз «В'єтнамський талант 2018», другий приз «В'єтнамський талант 2020»

- Сертифікат про наявність в'єтнамської базової технології в Національній програмі цифрової трансформації 2025-2030 років Міністерства інформації та зв'язку

- Проєкт-переможець нагороди Vietnam Digital Media Award 2018 та фонду Vingroup Fund 2019.

Регіональне бачення

Після підтвердження своїх позицій на в'єтнамському ринку, Vbee прагне розширитися до Південно-Східної Азії, плануючи до 2026 року впровадити свою технологію TTS у таких країнах, як Лаос, Таїланд, Камбоджа та Філіппіни.

За словами доктора Нгуєн Тхі Тху Транга, швидкий розвиток технологій сьогодні з появою багатомовних моделей полегшить розробку інструментів синтезу мовлення (TS) для інших мов.

Наразі вона досліджує технології мовлення для тайської, китайської та англійської мов, відкриваючи нові можливості для Vbee на міжнародному ринку.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. В'єтнамський стартап отримав нагороду на саміті зі штучного інтелекту в Парижі

Enfarm, стартап у сфері технологій штучного інтелекту (ШІ) для в'єтнамського сільського господарства, є одним із чотирьох представників Азії серед 50 проектів, представлених на саміті ШІ в Парижі (Франція) 10 та 11 лютого.



Джерело: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Відкрийте для себе єдине село у В'єтнамі, яке входить до списку 50 найкрасивіших сіл світу
Чому цього року популярні ліхтарі з червоними прапорами та жовтими зірками?
В'єтнам переміг у музичному конкурсі «Інтербачення 2025»
Затор на Му Канг Чай до вечора, туристи стікаються на пошуки стиглого рису в сезоні

Того ж автора

Спадщина

Фігура

Бізнес

No videos available

Новини

Політична система

Місцевий

Продукт