Le concours de traitement automatique du langage et de la parole vietnamiens (VLSP) s'inscrit dans le cadre de la conférence internationale annuelle sur le traitement automatique du langage et de la parole vietnamiens, organisée par le club VLSP, une branche de l'Association vietnamienne des technologies de l'information. VLSP 2023 propose 10 compétitions de traitement de la parole et du texte, réunissant des chercheurs, des experts et des entreprises de développement technologique de premier plan. Viettel AI, participant à VLSP 2023, a remporté le premier prix dans deux catégories : reconnaissance vocale et reconnaissance des émotions vocales, ainsi que traduction automatique vietnamien-lao.

La reconnaissance vocale automatique, en particulier, est un problème majeur du traitement de la parole, car elle permet de convertir les signaux vocaux en texte. Cette année, grâce à une nouvelle structure des catégories du concours, les équipes devaient résoudre simultanément deux problèmes : la reconnaissance vocale et la reconnaissance des émotions dans la parole. L'équipe Viettel AI a non seulement relevé ce défi avec brio, remportant ainsi le premier prix et impressionnant avec un score exceptionnel de 89,18 % (contre 83,40 % et 78,45 % pour les équipes suivantes).

Selon un représentant de Viettel AI, ce résultat exceptionnel s'explique par la maîtrise précoce de la technologie par Viettel AI. Au lieu d'utiliser des modèles issus de recherches existantes, Viettel AI a développé un modèle spécifiquement conçu pour le traitement de la parole vietnamienne, qu'elle a continuellement mis à jour et optimisé. Grâce à la mise en place d'un cycle d'apprentissage capable de traiter des données de qualité variable, les ingénieurs ont réussi à créer un modèle capable de reconnaître avec une grande précision le texte et les émotions des phrases, même avec des données limitées.

aaaaaaaaaa.jpg
Les ingénieurs de la plateforme d'assistant virtuel Viettel AI participent aux catégories de reconnaissance vocale et de reconnaissance des émotions vocales.

La technologie avancée de traitement de la parole a permis d'obtenir des résultats significatifs pour les produits d'IA de Viettel, tels que les systèmes d'assistants virtuels et les standards téléphoniques virtuels. Ces derniers peuvent reconnaître les voix avec une précision allant jusqu'à 95 % et les intentions des clients avec une précision allant jusqu'à 96 %. En particulier, les résultats de la recherche technologique menée par la concurrence sur la reconnaissance vocale et émotionnelle ouvriront la voie à de nouvelles applications dans le service client, en exploitant les informations issues des appels entrants. Les réclamations et les appels négatifs des clients vers le standard téléphonique représentent souvent une petite partie des centaines de milliers d'appels reçus chaque jour par le service d'assistance, mais ont un impact considérable sur la qualité du service. Au lieu d'investir dans du personnel pour écouter et traiter ces appels, comme auparavant, le standard téléphonique virtuel Viettel Cyberbot sera capable d'identifier et de gérer automatiquement les réclamations des clients dès la réception de l'appel.

À travers ce concours, Viettel AI réaffirme sa détermination à être pionnière dans le développement et l'application des technologies de traitement de la parole les plus avancées afin d'améliorer la qualité des produits et des services.

Quoc Tuan