Vietnam.vn - Nền tảng quảng bá Việt Nam

Компания Vbee и её усилия по продвижению вьетнамского языка.

Báo Tuổi TrẻBáo Tuổi Trẻ17/02/2025

Войдя в зал ожидания аэропорта, среди суетливых толп возвращающихся из деловых поездок, Хо Минь Дык на несколько секунд замер, услышав мягкий, знакомый женский голос, зачитывающий объявление по громкоговорителю.


Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 1.

Сотрудники Vbee работают в головном офисе компании в Ханое. Фото: Предоставлено компанией.

Он улыбнулся, чувствуя облегчение и радость, словно воссоединился с любимым человеком. Этим «любимым человеком» был один из 20 искусственных актеров озвучивания, с которыми Дюк и команда Vbee работали бесчисленное количество дней и месяцев, вкладывая душу в каждый нюанс звука и тщательно прорабатывая каждый из них, чтобы сделать их все более естественными и похожими на людей.

Тернистый путь стартапов

Генеральный директор Хо Минь Дык и технический директор Нгуен Тхи Тху Транг – два основателя акционерного общества Vbee Data Services and Solutions – бесчисленное количество раз испытывали подобную радость и гордость.

Они снова встречали этих «особых знакомых» в самых разных обстоятельствах: чистые голоса из школьных громкоговорителей, теплый тон в зданиях или профессиональные голоса из автоматизированных телефонных систем многих предприятий.

Созданные Vbee разработки — это уже не просто результат работы алгоритмов и кода; они действительно воплощаются в жизнь, внося незаметный, но значительный вклад во многие области.

От обзоров книг и дубляжа фильмов до автоматизированных объявлений в колл-центрах — Vbee вдохнула новую жизнь в голосовые технологии.

Будучи «матерью» этой ключевой технологии синтеза речи, доктор Нгуен Тхи Тху Транг всегда стремилась предоставить реальным пользователям продукты, созданные на основе вьетнамской технологии синтеза речи – технологии, в которую она вложила много страсти еще со времен своей докторской диссертации в Университете Париж-11.

Первые два года существования Vbee были полны трудностей. Несмотря на то, что инструмент преобразования текста в речь (TTS) был бесплатным в течение первых двух лет, он привлек лишь небольшую группу пользователей. Но затем COVID-19 неожиданно стал поворотным моментом.

В условиях строгих правил социального дистанцирования таким компаниям, как FE Credit, Momo, Viet Credit, Sacombank и другим, приходилось искать способы охватить тысячи клиентов. Именно тогда у Vbee появилась возможность: от напоминаний о задолженности до автоматизированных ответов, их продукт быстро стал оптимальным решением. В то время виртуальные ассистенты и виртуальные операторы колл-центров приносили до 80% дохода Vbee.

По мере того как пандемия утихала и мировая экономика спадала, компания Vbee столкнулась с новой проблемой. Волна генеративного искусственного интеллекта (GenAI) и тренд на цифровой контент возродили инструмент преобразования текста в речь (TTS). Сегодня, от TikTok до YouTube и Facebook, голоса, созданные с помощью ИИ от Vbee, звучат повсюду.

«Большая часть текущего контента для преобразования текста в речь предоставляется нами», — с гордостью заявил Хо Минь Дык. В настоящее время число активных пользователей Vbee превысило 2 миллиона, и это число продолжает неуклонно расти на 20% каждый месяц.

Компания Vbee обучила более 20 высококачественных голосов для корпоративных систем, а если учесть голоса, созданные по индивидуальному заказу, то общее количество различных голосов, созданных с помощью искусственного интеллекта, превышает 200.

Благодаря недавно разработанной и запущенной в тестирование новой технологии транскрипции голоса, для обучения нового голоса теперь требуется всего 3 минуты записи данных, вместо 4-10 часов записи, как это было два года назад.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 2.

Генеральный директор Хо Минь Дык и технический директор Нгуен Тхи Тху Транг — два основателя акционерного общества Vbee Data Services and Solutions — Фото: Предоставлено компанией.

«Мы обладаем преимуществом в понимании вьетнамского языка».

В гонке за технологиями синтеза речи генеральный директор Хо Мин Дык видит момент, когда усилия по внедрению инновационных технологий постепенно достигнут своих пределов.

По его словам, компания Vbee не только разрабатывает базовую технологию обработки речи на вьетнамском языке, но и создает технологическую систему, способную глубоко понимать вьетнамский язык — со всеми его тонкостями, тонами и уникальной культурой, которую в полной мере могут понять только настоящие вьетнамцы.

Будучи ведущей компанией на рынке синтеза речи во Вьетнаме, два руководителя Vbee считают, что их инструмент стал эталоном для озвучивания на вьетнамском языке с помощью ИИ. Пользователи ценят не только точность, но и чувствуют «эмоции» в каждом голосе, созданном Vbee.

Например, во вьетнамском языке даже одно слово, такое как "ngõ" (переулок), имеет множество разных названий в зависимости от региона, например, "hẻm", "kiệt" и "xẹc" — каждое слово несёт в себе свой особый оттенок, который должен понимать искусственный интеллект.

Для достижения этой цели компания Vbee вложила значительные средства в сбор образцов данных, а также в мощную серверную систему для обучения искусственного интеллекта.

«Чтобы позволить ИИ понимать и корректно обрабатывать информацию с такими региональными нюансами, нам пришлось создать бесчисленное количество наборов данных, а стоимость серверов для обработки информации также была очень высока», — поделился генеральный директор Хо Минь Дык.

Доктор Нгуен Тхи Тху Транг посвятила более 15 лет исследованию основной технологии преобразования текста в речь (TTS) компании Vbee, чтобы расшифровать характерные тоны и грамматику вьетнамского языка. Для нее родной язык — это тонкий мир, полный выразительных нюансов.

«Вьетнамский язык очень сложный и интересный; тональная система — самая сложная его часть, отличающаяся от многих других распространенных языков мира. Чем лучше я пойму этот язык, тем точнее будет моя модель», — объяснила она.

Vbee постепенно становится незаменимым компонентом инструментов и устройств, интегрирующих программное обеспечение для обработки вьетнамского языка в технологическую эпоху.

В каждом слове и каждом голосе команда Vbee не только исследует и разрабатывает технологии, но и стремится создать подлинные «вьетнамские эмоции» в голосах своих искусственных интеллектов.

Название Vbee — это аббревиатура от «Vietnamese BE your Eyes» (Вьетнамское «Будь своими глазами»), возникшая из моего первоначального желания создать инструмент, который служил бы «глазами» для людей с нарушениями зрения. Однако в современном развивающемся мире, где многие люди ставят слух выше зрения, мы считаем, что Vbee станет «глазами» и для всех.

Доктор Нгуен Тхи Тху Транг (старший преподаватель Школы информационных технологий и коммуникаций Ханойского университета науки и технологий, основатель и технический директор компании Vbee)

Встреча любителей аудиокниг

Vbee появился благодаря глубокой связи доктора Нгуен Тхи Тху Транг с сообществом людей с нарушениями зрения. Еще со студенческих лет она занималась записью аудиокниг и разработкой вьетнамских систем преобразования текста в речь для поддержки людей с нарушениями зрения.

Этот опыт вдохновил ее на разработку вьетнамского программного обеспечения для преобразования текста в речь — предшественника Vbee. В 2018 году она и ее однокурсник Хо Минь Дык — также студент Ханойского университета науки и технологий, имевший опыт работы над проектом Socbay.com и оцифровкой аудиокниг, — основали Vbee, пионера в области преобразования текста в речь во Вьетнаме.

Выдающиеся достижения Vbee

- Победитель конкурса Qualcomm Vietnam Innovation Challenge 2024, занявший первое место.

- Специальная премия на конкурсе молодежных стартапов 2023 года.

- Стартап стал победителем акселерационной программы Grab Venture Ignite 2020.

- Главный приз на конкурсе Vietnam Talent Awards 2018, второй приз на конкурсе Vietnam Talent Awards 2020.

- Сертифицировано как ключевая технология Вьетнама в рамках Национальной программы цифровой трансформации на 2025-2030 годы Министерства информации и коммуникаций.

- Проект получил премию Vietnam Digital Media Award 2018 и премию Vingroup Funding Award 2019.

Региональное видение

Укрепив свои позиции на вьетнамском рынке, компания Vbee стремится расширить свое присутствие в Юго-Восточной Азии, планируя к 2026 году внедрить свою технологию преобразования текста в речь (TTS) в таких странах, как Лаос, Таиланд, Камбоджа и Филиппины.

По словам доктора Нгуен Тхи Тху Транг, стремительное развитие современных технологий, в частности появление многоязычных моделей, упростит разработку инструментов синтеза речи для других языков.

В настоящее время она занимается исследованием голосовых технологий для тайского, китайского и английского языков, что открывает новые возможности для Vbee на международном рынке.

Vbee và nỗ lực chắp cánh cho tiếng Việt - Ảnh 3. Вьетнамский стартап удостоен награды на Парижском саммите по искусственному интеллекту.

Enfarm, вьетнамский стартап, занимающийся разработкой технологий искусственного интеллекта для сельского хозяйства, является одним из четырех азиатских представителей среди 50 проектов, представленных на саммите AI Action Summit в Париже, Франция, 10 и 11 февраля.



Источник: https://tuoitre.vn/vbee-va-no-luc-chap-canh-cho-tieng-viet-20250217102146767.htm

Комментарий (0)

Оставьте комментарий, чтобы поделиться своими чувствами!

Та же тема

Та же категория

Тот же автор

Наследство

Фигура

Предприятия

Актуальные события

Политическая система

Местный

Продукт

Happy Vietnam
Оседлав летние волны

Оседлав летние волны

фотография матери и ребенка

фотография матери и ребенка

человеческое взаимодействие и связь

человеческое взаимодействие и связь