Vietnam.vn - Nền tảng quảng bá Việt Nam

Інженер-дзен компанії Zalo AI представляє дослідження на провідній світовій науковій конференції

Việt NamViệt Nam11/09/2024


Дослідницька робота, спрямована на підвищення точності моделей розпізнавання мовлення в реальному часі (Streaming Automatic Speech Recognition), проведена Ле Дуєм Ханем - інженером "покоління Z" компанії Zalo AI, - буде вперше оголошена на Міжнародній науковій конференції , яка відбудеться в Греції у вересні 2024 року.

Дослідницька робота інженера штучного інтелекту Zalo 2000 року народження на тему « Покращення потокового розпізнавання мовлення за допомогою зміщеної в часі контекстної уваги та динамічного маскування правого контексту » отримала майже ідеальний бал – 11/12 балів , пройшовши ретельний раунд рецензування з понад 2000 доповідями-учасниками, які будуть представлені на конференції Interspeech у формі усної сесії.


«
Я дуже пишаюся тим, що мою першу наукову статтю було відзначено престижною науковою конференцією, і я маю можливість представити дослідницькі досягнення В'єтнаму великим технологічним компаніям, експертам та міжнародній спільноті », – поділився Ле Зуй Кхань.

Під керівництвом доктора Чау Тхань Дика – керівника відділу досліджень та розробок Zalo AI, викладача Університету природничих наук (Національний університет міста Хошимін), очікується, що цей дослідницький проект зробить важливий внесок у вдосконалення моделей розпізнавання мовлення, підвищення точності голосового диктування та перетворення голосу в текст у застосунку Zalo.

« Синтезування високопрактичних досліджень Zalo AI у наукові статті та їх презентація на престижних міжнародних конференціях є дуже важливим. Це не лише демонструє потенціал в’єтнамських інженерів, але й демонструє бажання ділитися досвідом та робити свій внесок у розвиток світової спільноти штучного інтелекту», – сказав доктор Чау Тхань Дик.

Раніше, з кінця 2023 року, Zalo інтегрувала це дослідження у свій месенджер, що допомогло значно покращити точність функції «складання голосових повідомлень». Ця функція дозволяє користувачам складати повідомлення голосом, а не друкувати їх від руки, що заощаджує час і робить її зручнішою в багатьох ситуаціях використання. Водночас, точність цієї функції на практиці досягла 95%; рівень необхідності повторного редагування тексту після написання голосом знизився з 6,4% до лише 4,8%.


Згідно зі статистикою Zalo, хоча функція все ще перебуває на стадії тестування, вона генерувала майже 4,5 мільйона повідомлень на день і залучала близько 3,2 мільйона користувачів щомісяця (дані оновлені станом на червень 2024 року).

З моменту початку своєї новаторської подорожі в дослідженнях штучного інтелекту в 2017 році, Zalo завжди вірила в «розширення можливостей» молодого покоління. Наразі до 31% співробітників Zalo належать до покоління GenZ. У 2021 році дві інші дослідницькі теми команди інженерів Zalo AI, пов'язані з технологією обробки мовлення, також були визнані на Азіатсько- Тихоокеанській міжнародній конференції зі штучного інтелекту (PRICAI 2021). Примітно, що автори цих двох тем є молодими дослідниками віком до 30 років.

Interspeech – це давня, комплексна та престижна міжнародна конференція з обробки мовлення, організована Міжнародною асоціацією мовленнєвої комунікації. Цього року конференція на тему «Мовлення та не тільки » відбудеться з 1 по 5 вересня 2024 року на острові Кос (Греція).

Джерело: https://www.vng.com.vn/news/people/ky-su-genz-cua-zalo-ai-gioi-thieu-nghien-cuu-tai-hoi-nghiem-khoa-hoc-hang-dau-the-gioi.html


Коментар (0)

No data
No data

У тій самій темі

У тій самій категорії

Сезон цвітіння гречки, Хазянг - Туєн Куанг стає привабливим місцем реєстрації
Спостереження за сходом сонця на острові Ко То
Мандруючи серед хмар Далата
Квітучі очеретяні поля в Данангу приваблюють місцевих жителів та туристів.

Того ж автора

Спадщина

Фігура

Бізнес

В'єтнамська модель Хюїнь Ту Ань користується попитом серед міжнародних модних будинків після показу Chanel.

Поточні події

Політична система

Місцевий

Продукт