Lors de la NAACL 2025, l'une des trois principales conférences mondiales sur le traitement du langage naturel organisée aux États-Unis, Viettel AI a présenté VeGraph. Il s’agit d’une nouvelle méthode de vérification des faits qui améliore la précision de 2 à 5 % par rapport aux méthodes existantes sur deux ensembles de données de vérification des faits populaires, HoVer et FEVEROUS.
La diffusion d’Internet et des réseaux sociaux a rendu les fausses nouvelles et la désinformation de plus en plus courantes, en particulier dans des domaines sensibles tels que la santé , les catastrophes naturelles et les politiques publiques. Ce problème devient encore plus grave lorsque ces fausses informations deviennent des données d’entrée pour des systèmes d’IA tels que des chatbots ou des assistants virtuels. Si elle n’est pas contrôlée, l’IA peut diffuser involontairement, voire créer, de la désinformation.
VeGraph est une méthode de vérification des informations recherchée, développée et présentée par Viettel AI lors de la conférence NAACL 2025.
La vérification des faits est le processus de vérification de la véracité ou de la fausseté d’une déclaration sur la base de sources fiables telles que des journaux, de la littérature scientifique ou des bases de données officielles. Pour ce faire, les systèmes d’IA doivent être capables de comprendre le langage, de récupérer des données et de raisonner de manière logique.
Né de l'équipe d'ingénierie du Viettel Data and Artificial Intelligence Service Center, VeGraph (Verify-in-the-Graph) décompose les demandes de vérification en petites clauses et les compare à des sources faisant autorité telles que des documents juridiques, des données gouvernementales et des documents spécialisés. Contrairement à de nombreuses méthodes actuelles qui s'appuient uniquement sur de grands modèles de langage (LLM), VeGraph organise le processus de vérification en étapes claires, augmentant la transparence et réduisant le phénomène d'« illusion » - lorsque l'IA crée automatiquement de fausses informations.
En plus d’être efficace dans la vérification des informations, VeGraph est également très applicable. Cette technologie peut être intégrée aux systèmes d’IA pour améliorer la fiabilité ou déployée de manière indépendante dans des domaines tels que la médecine, le journalisme, le droit ou la gestion de l’État. Les gens peuvent l’utiliser entièrement pour vérifier eux-mêmes des informations importantes qui nécessitent une grande authenticité, telles que l’actualité, les informations sur les médicaments, les vaccins ou les réglementations légales.
À l’avenir, Viettel AI vise à développer VeGraph pour traiter plusieurs formats de données tels que des images, des vidéos et de l’audio ; tout en augmentant la capacité à comprendre un langage complexe tel que les métaphores, les connotations et en intégrant des graphiques de connaissances pour améliorer les capacités de raisonnement.
NAACL 2025 (Conférence annuelle du chapitre des Nations des Amériques de l'Association pour la linguistique computationnelle) est le principal forum scientifique prestigieux au monde dans le domaine du traitement du langage naturel et de la linguistique computationnelle.
Cette année, la conférence a attiré un nombre record de communications, plus de 3 000, avec un taux d’acceptation très compétitif pour les communications clés (environ 22 %), rassemblant les recherches les plus innovantes.
NAACL 2025 se concentre spécifiquement sur les avancées révolutionnaires dans le développement de grands modèles linguistiques, le traitement du langage naturel interculturel et multilingue, les capacités d'inférence émergentes et l'IA responsable.
Source : https://nld.com.vn/ai-cua-nguoi-viet-biet-kiem-tra-thong-tin-biet-noi-su-that-196250517125935127.htm
Comment (0)