
Professeur associé Luu Anh Tuan - Directeur exécutif du Centre de recherche en intelligence artificielle (IA) de l'Université VinUni.
Quand l'IA étrangère « abandonne » face à la complexité de la langue vietnamienne.
Dans le contexte de la transition marquée du Vietnam d'une nation utilisatrice d'IA à une nation créatrice d'IA, le professeur associé Luu Anh Tuan soutient que le recours exclusif à des modèles étrangers comme ChatGPT comporte des risques importants. Bien que ces outils prennent en charge la langue vietnamienne, leur qualité reste en deçà des attentes en raison d'une compréhension insuffisante de la culture et du contexte locaux.
Le principal défi souligné par le professeur agrégé Tuan réside dans la complexité de la langue vietnamienne.
« La langue vietnamienne possède de nombreuses caractéristiques uniques par rapport à beaucoup d'autres langues dans le monde . Même la façon dont nous nous adressons les uns aux autres, comme "tante, oncle, grand-parent", est très complexe, si bien que les systèmes d'IA courants dans le monde entier ne peuvent pas la comprendre », a déclaré le professeur agrégé Luu Anh Tuan.
De plus, la diversité dialectale entre les trois régions du Nord, du Centre et du Sud du Vietnam, ainsi que des facteurs historiques spécifiques, constituent également des « angles morts » où les modèles internationaux — qui sont entraînés sur des données générales — rencontrent souvent des problèmes lors du traitement de l'information.
« Si nous continuons à interroger ChatGPT et à payer, nous ne pourrons qu'utiliser l'IA, et non développer une intelligence artificielle », a souligné le professeur associé Luu Anh Tuan.
Cela soulève des questions urgentes concernant la souveraineté numérique et la souveraineté en matière d'IA, obligeant le Vietnam à atteindre l'autosuffisance technologique pour éviter toute dépendance vis-à-vis des pays étrangers.
Pour construire son propre modèle linguistique à grande échelle, le plus grand défi du Vietnam aujourd'hui est celui des données. Le professeur agrégé Tuan le reconnaît franchement : « Les données vietnamiennes sont à la fois rares et dispersées sur différents sites. »
Actuellement, la collecte de données repose principalement sur des groupes de recherche qui recueillent des données sur Internet de manière indépendante et les filtrent manuellement ; il n’existe pas d’entreprises spécialisées dans le traitement de données à grande échelle. De plus, le Vietnam ne dispose pas de critères d’évaluation standardisés permettant de mesurer la précision et la fiabilité des modèles linguistiques dans son contexte culturel national.
Face à cette situation, le professeur agrégé Tuan a suggéré que le gouvernement joue le rôle de chef d'orchestre, en créant des centres de données nationaux pour consolider les données provenant de divers ministères et secteurs (santé, justice, éducation , etc.), contribuant ainsi à éviter le gaspillage de ressources et à garantir la cohérence des informations. Il a également souligné la nécessité d'une agence unique chargée de vérifier les listes de données fiables, jetant ainsi les bases d'une utilisation sécurisée de ces données par les développeurs à l'avenir.
La stratégie « open source » et le désir de contribuer.
Malgré les immenses défis, la conviction et la détermination du professeur associé de l'Université technologique de Nanyang (NTU Singapour) sont inébranlables. Après 17 ans d'études et de travail à l'étranger, le professeur associé Tuan a décidé d'accepter l'invitation du professeur Duong Nguyen Vu à rentrer à Singapour et à devenir directeur exécutif du Centre de recherche en intelligence artificielle de VinUniversity.
Expliquant les raisons de son retour, il a déclaré : « En réalité, les Vietnamiens vivant à l’étranger, comme moi, souhaitent toujours rentrer au pays pour servir leur nation. » Il y voit une opportunité de mettre en relation les ressources de connaissances internationales et la formation des talents au Vietnam. Actuellement, grâce au mécanisme de coopération flexible entre l’Université technologique de Nanyang (NTU) de Singapour et l’Université VinUniversity, il s’emploie à faciliter les échanges entre étudiants vietnamiens et étrangers.
La stratégie que poursuit le professeur agrégé Tuan n'est pas de créer un modèle fermé, mais de le rendre open source.
« Le Vietnam devrait privilégier les modèles open source afin que les petites entreprises et les communautés puissent les hériter et les développer, créant ainsi un écosystème d'IA robuste », a commenté M. Tuan.
Il a également insisté sur la nécessité de construire une « IA de confiance » reposant sur cinq piliers : la sécurité, la responsabilité, la confidentialité, l'équité et la transparence.
« L’avantage du Vietnam est qu’il est arrivé tardivement dans ce domaine, qu’il n’est pas encombré par des systèmes de données obsolètes contenant beaucoup de fausses informations, ce qui lui permet d’établir une base éthique dès le départ », a déclaré le professeur agrégé Luu Anh Tuan.
Selon le professeur agrégé Luu Anh Tuan, la mise en place d'un modèle linguistique « Fabriqué au Vietnam » à grande échelle ne se résume pas à une simple course technologique ; c'est aussi une question de souveraineté culturelle et intellectuelle. Au lieu de continuer à dépendre de solutions étrangères coûteuses et inadaptées aux réalités culturelles, le Vietnam a une occasion unique de construire un écosystème d'IA fiable, transparent et ouvert. Fort de son statut de pays « arrivé plus tard », qui lui permet d'établir des normes éthiques dès le départ, et grâce à la coopération du gouvernement, le professeur agrégé Tuan estime que l'ambition de transformer le Vietnam, d'une nation « utilisant l'IA » à une nation « créatrice d'IA » et leader régional d'ici 2030, est tout à fait réalisable.
Hien Thao
Source : https://doanhnghiepvn.vn/cong-nghe/giac-mo-chu-quyen-ai-va-quyet-tam-xay-dung-mo-hinh-ngon-ngu-lon-tieng-viet-cua-pgs-luu-anh-tuan/20260216100302351






Comment (0)