Interface de la version 7, clavier intégrant l'IA. Photo : NVCC . |
Dans un entretien avec Tri Thuc - Znews , Tri Duc (né en 2003) a évoqué son projet d'utiliser l'intelligence artificielle pour révolutionner la saisie du vietnamien. Son outil de saisie v7, initialement développé comme projet étudiant, a fait l'objet d'un article de recherche et a été accepté à IJCAI 2025, une conférence prestigieuse sur l'IA.
Malgré sa popularité depuis des décennies, la saisie Telex ou VNI présente encore de nombreuses limitations en termes d'expérience utilisateur. C'est pourquoi la version 7 a été conçue comme un outil de prédiction léger, permettant de réduire le temps de saisie du vietnamien grâce à l'intégration de l'IA.
Passion pour les langues et la technologie
Sa passion pour les langues et la technologie l'a amené à se spécialiser en intelligence artificielle appliquée à l'Université de technologie de Hô Chi Minh-Ville.
Durant ses études, il a travaillé sur des projets tels qu'un modèle de langage à grande échelle (LLM) pour le vietnamien, un logiciel de traduction automatique pour les langues des minorités ethniques et un chatbot d'aide aux admissions. « Ces expériences m'ont permis d'acquérir de solides connaissances, de nourrir ma passion et mon désir d'appliquer l'IA pour créer des produits utiles à la communauté », a-t-il confié.
Tri Duc souhaite donner de la valeur ajoutée à l'application de l'IA dans la vie quotidienne. Photo : NVCC. |
De plus, grâce à sa connaissance du mandarin et du cantonais, Duc a perçu la corrélation entre le pinyin/jyutping et l'orthographe vietnamienne. Ce facteur permet également de constater que, contrairement à la complexité des hiéroglyphes, le système de transcription pinyin chinois ne nécessite que la frappe de « yn » pour obtenir le nom de notre pays en caractères chinois. En revanche, le télex ou le VNI requièrent 10 touches pour obtenir le mot « Vietnam ».
Grâce à ses observations, Duc a constaté que, lorsqu'ils communiquent rapidement, les utilisateurs abrègent souvent en ne conservant que la première consonne, comme « hs » pour « student ». « Si les humains comprennent facilement ce style d'écriture, l'IA peut parfaitement le comprendre si elle est entraînée avec les données appropriées », a-t-il déclaré à propos des circonstances qui ont donné naissance à cette idée.
Au lieu de devoir saisir le caractère complet puis ajouter les accents comme avec les outils de saisie traditionnels tels que Telex ou VNI qui fonctionnent par addition, la version 7 utilise l'IA pour suggérer le mot que vous souhaitez écrire. Cette technologie prédit avec précision le mot complet en un minimum de frappes.
En vietnamien, un mot se compose d'une consonne initiale, d'une rime et d'un ton. Par exemple, « Nguyen » est composé de « ng », « uyen » et d'un ton descendant. C'est sur ce principe que repose le moteur de saisie v7, capable de prédire des mots complets à partir de la consonne initiale et du ton seulement, ce qui permet de réduire considérablement le nombre de frappes tout en conservant une grande précision.
Le défi de l'enseignement du vietnamien à l'IA
D'après Duc, le principal défi consiste à apprendre à l'IA à « comprendre » le vietnamien pour cet outil de saisie. Il a testé de nombreux modèles avant de choisir GPT-2 comme base, avec une architecture Transformers pour une bonne compréhension du contexte et une prédiction précise des mots.
Après avoir choisi l'architecture sous-jacente, Duc a entièrement remplacé le tokenizer (encodeur de vocabulaire) par un vocabulaire vietnamien qu'il avait lui-même conçu. L'ingénieur a filtré tous les mots vietnamiens valides et correctement orthographiés afin de garantir un traitement exhaustif, capable de prédire n'importe quel mot que l'utilisateur souhaitait saisir.
Un autre défi consiste à trouver un équilibre entre performance prédictive et rapidité de réponse, afin de garantir que le modèle puisse fonctionner en temps réel sur ordinateurs et téléphones, tout en conservant une puissance suffisante pour effectuer les meilleures prédictions. Après deux mois de tests continus, la version actuelle affiche correctement près de 70 % des mots saisis par les utilisateurs en tête de liste, avec une latence de seulement 0,03 seconde.
Concernant la saisie au clavier, d'après de nombreuses études consultées par Duc, notamment celles des linguistes Cao Xuan Hao et Henri Maspero, le vietnamien possède non pas six, mais huit tons. Pour tirer parti de cette particularité, le clavier v7 utilise un système à huit tons au lieu des six habituels (incluant un ton bémol et cinq tons accentués : dièse, bémol, interrogatif, descendant et lourd). Sur ce clavier, la saisie de « v7 » suggère le mot « Viet », d'où le nom du produit.
Après avoir partagé la version 7 sur ses réseaux sociaux, Duc s'est dit très heureux et surpris de l'intérêt, du soutien et de l'envie de tester suscités par le modèle. « Cela m'a clairement fait prendre conscience du besoin d'un outil de saisie vietnamienne plus intelligent et plus rapide », a-t-il déclaré.
L'équipe d'auteurs de l'article de recherche scientifique . De gauche à droite : Nhat Khang, Hieu Nghia et Tri Duc. Photo : NVCC. |
Le clavier est actuellement encore au stade de prototype, son code source étant disponible sur GitHub pour permettre aux programmeurs et aux utilisateurs de technologies de le tester et d'y contribuer. Une application complète pour Windows et macOS est également en cours de développement afin de faciliter son installation et son utilisation par le grand public.
À l'avenir, la priorité absolue de la version 7 sera l'amélioration du clavier pour iPhone, afin de simplifier la saisie de texte vietnamien sur smartphones. De plus, la précision du modèle sera optimisée grâce à un entraînement plus poussé sur des données de conversations quotidiennes, permettant ainsi à l'IA de mieux comprendre les contextes courants.
Le parcours de Duc a insufflé un vent de créativité, en phase avec les tendances technologiques, dans un contexte où le Vietnam investit massivement dans l'infrastructure d'IA. Il est particulièrement fier du moment où v7 a généré pour la première fois une phrase complète. « À cette époque, un petit modèle, probablement 10 000 fois plus petit que ChatGPT aujourd'hui, pouvait encore penser comme un humain », a déclaré Duc.
Source : https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html






Comment (0)