Konkurs „Przetwarzanie języka i mowy wietnamskiej – VLSP” jest częścią corocznej międzynarodowej konferencji poświęconej przetwarzaniu języka i mowy wietnamskiej, organizowanej przez klub VLSP, oddział Wietnamskiego Stowarzyszenia Technologii Informacyjnych. VLSP 2023 organizuje 10 konkursów poświęconych przetwarzaniu mowy i tekstu, gromadząc czołowych badaczy, ekspertów i jednostki rozwoju technologii. Uczestnicząc w konkursie „Przetwarzanie języka i mowy wietnamskiej 2023”, firma Viettel AI zdobyła główną nagrodę w dwóch kategoriach: rozpoznawanie mowy i rozpoznawanie emocji w mowie oraz tłumaczenie maszynowe z języka wietnamsko-laotańskiego.
W szczególności automatyczne rozpoznawanie mowy (AMS) stanowi jeden z istotnych problemów przetwarzania mowy, umożliwiający konwersję sygnałów mowy na odpowiadający im tekst. W tym roku, dzięki innowacyjnej strukturze kategorii konkursowych, zespoły musiały rozwiązać dwa zadania jednocześnie: rozpoznawanie mowy i rozpoznawanie emocji. Viettel AI nie tylko sprostał temu wyzwaniu, zdobywając pierwszą nagrodę, ale także zachwycił znakomitym wynikiem 89,18% (kolejne zespoły uzyskały odpowiednio 83,40% i 78,45%).
Według przedstawiciela Viettel AI, kluczem do uzyskania tak znakomitego wyniku dokładności jest to, że Viettel AI wcześnie opanował tę technologię. Zamiast korzystać z modeli dostępnych wyników badań, Viettel AI opracował od podstaw model specjalnie do przetwarzania mowy wietnamskiej, który jest stale aktualizowany i optymalizowany pod kątem wydajności. W połączeniu z wdrożeniem cyklu treningowego, który może przetwarzać wszystkie dane w różnych warunkach jakości, inżynierowie z powodzeniem zbudowali model, który potrafi rozpoznawać zarówno tekst, jak i emocje w zdaniu z wysoką dokładnością, przy ograniczonej ilości danych.
Zaawansowana technologia przetwarzania mowy przyniosła znaczące rezultaty produktom Viettel AI, takim jak systemy asystentów wirtualnych i wirtualne centrale telefoniczne, które rozpoznają głosy z dokładnością do 95% oraz intencje klientów z dokładnością do 96%. W szczególności wyniki badań technologicznych nad rozpoznawaniem głosu i emocji konkurencji otworzą nowe możliwości w obsłudze klienta, wykorzystując informacje z połączeń z centrali telefonicznej. Skargi i negatywne połączenia od klientów do centrali telefonicznej często stanowią niewielką liczbę, a nawet setki tysięcy połączeń na infolinię każdego dnia, ale mają ogromny wpływ na jakość obsługi. Zamiast wydawać pieniądze na zatrudnianie osób do słuchania i oznaczania tych połączeń, jak dotychczas, wirtualna centrala telefoniczna Viettel Cyberbot będzie w stanie automatycznie identyfikować i obsługiwać skargi klientów natychmiast po otrzymaniu połączenia.
Poprzez konkurs Viettel AI potwierdza swoją determinację w byciu pionierem w rozwijaniu i stosowaniu najbardziej zaawansowanych technologii przetwarzania mowy w celu poprawy jakości produktów i usług.
Quoc Tuan
Źródło
Komentarz (0)