Vietnam.vn - Nền tảng quảng bá Việt Nam

Un jeune ingénieur utilise l'IA pour changer la façon dont le vietnamien est saisi.

Le clavier vietnamien intégrant l'IA est l'un des produits qui allie avec succès créativité et expertise, dans le but d'apporter une valeur pratique à la communauté.

ZNewsZNews14/05/2025


Interface de la version 7, clavier intégrant l'IA. Photo : Fournie par l'auteur .

Dans un entretien accordé à Tri Thức - Znews , Tri Duc (né en 2003) a partagé son idée d'appliquer l'intelligence artificielle pour révolutionner la saisie du vietnamien. Son projet de clavier v7 a fait l'objet d'un article de recherche et a été accepté à IJCAI 2025, une prestigieuse conférence sur l'IA.

Bien que populaire depuis des décennies, la méthode de saisie Telex ou VNI présente encore de nombreuses limitations en termes d'expérience utilisateur. C'est pourquoi la version 7 a été créée : un outil de prédiction léger qui contribue à réduire le temps de saisie en vietnamien grâce à l'intelligence artificielle intégrée.

Une passion pour les langues et la technologie.

Sa passion pour les langues et la technologie a conduit Duc à se spécialiser en intelligence artificielle appliquée à l'Université de technologie de Hô Chi Minh-Ville.

Durant ses études, il a travaillé sur des projets tels que la modélisation linguistique à grande échelle (LLM) pour le vietnamien, des logiciels de traduction pour les langues des minorités ethniques et des chatbots pour faciliter le recrutement étudiant. « Ces expériences m'ont permis d'acquérir de solides connaissances, de nourrir ma passion et d'alimenter mon désir d'appliquer l'IA pour créer des produits utiles à la communauté », a-t-il confié.

Image 1 d'une planche en bois intégrant l'IA

Tri Duc ambitionne d'améliorer la vie grâce à l'intelligence artificielle. Photo : Fournie par la personne interviewée.

De plus, grâce à sa connaissance du mandarin et du cantonais, Duc a perçu la corrélation entre le pinyin/jyutping et l'orthographe vietnamienne. Ceci démontre également que, contrairement à la complexité des caractères idéographiques, la méthode de saisie du pinyin chinois ne requiert que la touche « yn » pour afficher le nom du Vietnam en caractères chinois. En revanche, Telex ou VNI nécessitent dix touches pour afficher « Vietnam ».

Grâce à ses observations, Duc s'est rendu compte que, dans les conversations rapides, les utilisateurs abrègent souvent en conservant la consonne initiale, comme « hs » pour « étudiant ». « Si les humains peuvent facilement comprendre ce style d'écriture, l'IA peut absolument le comprendre si elle est entraînée avec les bonnes données », a-t-il expliqué à propos des circonstances qui ont conduit à son idée.

Au lieu de saisir tous les caractères puis d'ajouter les signes diacritiques comme avec les méthodes de saisie traditionnelles telles que Telex ou VNI, qui reposent sur un mécanisme complémentaire, v7 utilise l'IA pour suggérer les mots que vous souhaitez écrire. Cette technologie prédit avec précision le mot complet en un minimum de frappes.

En orthographe vietnamienne, un mot se compose d'une consonne initiale, d'une voyelle et d'un ton. Par exemple, le mot « Nguyễn » est composé de « ng », « uyên » et d'un ton descendant. C'est sur ce principe que la méthode de saisie v7 a été développée pour prédire le mot complet à partir de la seule consonne initiale et du ton, réduisant ainsi considérablement le nombre de frappes tout en conservant une précision optimale.

Le défi de l'enseignement du vietnamien à l'IA.

Selon Duc, le principal défi consistait à apprendre à l'IA à « comprendre » le vietnamien afin d'utiliser cette méthode de saisie. Il a testé de nombreux modèles avant de choisir GPT-2 comme base, son architecture Transformers offrant une bonne compréhension du contexte et une prédiction précise des mots.

Après avoir choisi l'architecture sous-jacente, Duc a entièrement remplacé le tokenizer (encodeur de vocabulaire) par un vocabulaire vietnamien qu'il avait lui-même créé. L'ingénieur a filtré et inclus tous les mots vietnamiens valides et correctement orthographiés afin de garantir des capacités de traitement complètes et la possibilité de prédire n'importe quel mot que l'utilisateur souhaitait saisir.

Un autre défi consiste à trouver un équilibre entre performance prédictive et rapidité de réponse, afin de garantir que le modèle puisse fonctionner en temps réel sur ordinateurs et téléphones tout en conservant une puissance suffisante pour fournir les meilleures prédictions possibles. Après deux mois de tests continus, la version actuelle place correctement près de 70 % des mots saisis par les utilisateurs en haut de la liste, avec un délai de seulement 0,03 seconde.

Concernant la saisie au clavier, selon plusieurs études consultées par Duc et menées par les linguistes Cao Xuan Hao et Henri Maspero, le vietnamien possède non pas 6, mais jusqu'à 8 tons. Pour tirer parti de cette particularité, le clavier v7 utilise un système à 8 tons au lieu des 6 habituels (dont un ton neutre et 5 tons accentués : aigu, grave, interrogatif, tilde et point sous-ton). Sur ce clavier, lorsque vous saisissez « v7 », le modèle suggère le mot « Viet ». C'est d'ailleurs l'idée qui sous-tend le nom du produit.

Après avoir partagé la version 7 sur ses réseaux sociaux, Duc s'est dit très heureux et surpris de l'engouement suscité par le modèle, le soutien qu'il a reçu et l'envie de l'essayer. « Cela m'a clairement fait prendre conscience du besoin d'une méthode de saisie vietnamienne plus intelligente et plus rapide », a-t-il déclaré.

Planche en bois intégrant l'IA (image 2)

Les auteurs de l'article scientifique . De gauche à droite : Nhat Khang, Hieu Nghia et Tri Duc. Photo : Fournie par l'auteur.

La méthode de saisie est actuellement encore au stade de prototype, son code source étant disponible sur GitHub pour permettre aux programmeurs et utilisateurs techniques de la tester et d'y contribuer. Une version complète pour Windows et macOS est également en cours de développement pour le grand public, afin de simplifier son installation et son utilisation.

À l'avenir, la priorité absolue de la version 7 sera l'intégration du clavier iPhone, afin d'améliorer la saisie de texte vietnamien sur smartphones. De plus, la précision du modèle sera optimisée grâce à un entraînement plus poussé sur des données conversationnelles courantes, permettant ainsi à l'IA de mieux comprendre les contextes habituels.

Le parcours de Duc a contribué à insuffler une vague d'innovation, permettant de suivre le rythme des tendances technologiques dans un contexte d'investissements importants du Vietnam dans les infrastructures d'IA. Il est particulièrement fier du moment où v7 a généré pour la première fois une phrase complète. « C'est à ce moment-là qu'un petit modèle, probablement 1/10 000e de la taille de ChatGPT actuel, pouvait encore penser comme un humain », a déclaré Duc.

Source : https://znews.vn/ky-su-tre-dung-ai-thay-doi-cach-go-tieng-viet-post1552246.html


Comment (0)

Laissez un commentaire pour partager vos ressentis !

Même sujet

Même catégorie

Les villages de fleurs d'Hanoï sont en pleine effervescence en raison des préparatifs du Nouvel An lunaire.
Les villages d'artisans uniques s'animent d'activité à l'approche du Têt.
Admirez le jardin de kumquats unique et inestimable au cœur d'Hanoï.
Les pomelos de Dien « inondent » le Sud tôt, les prix montent en flèche avant le Têt.

Même auteur

Patrimoine

Chiffre

Entreprises

Les pomelos de Dien, d'une valeur de plus de 100 millions de dongs, viennent d'arriver à Hô Chi Minh-Ville et ont déjà été commandés par des clients.

Actualités

Système politique

Locale

Produit