Quand l'IA sait vérifier la vérité : nouvelle avancée de Viettel AI au NAACL 2025

Légende de la photo

VeGraph améliore la précision de 2 à 5 % par rapport aux méthodes existantes.

NAACL 2025 (Conférence annuelle du chapitre des Nations des Amériques de l'Association pour la linguistique computationnelle) est le principal forum scientifique prestigieux au monde dans le domaine du traitement du langage naturel et de la linguistique computationnelle.

Selon les informations de Viettel parues dans l'après-midi du 16 mai, l'explosion d'Internet et des réseaux sociaux a rendu les contenus générés par les utilisateurs de plus en plus populaires ; elle a également entraîné une vague de fausses nouvelles et d'informations non officielles largement diffusées. Ces fausses informations sèment non seulement la confusion dans des domaines sensibles comme la santé, les catastrophes naturelles, les politiques publiques, etc., mais entraînent également de graves conséquences, telles que des pertes économiques, une dégradation de la réputation des organisations et des menaces pour la sécurité nationale.

« Auparavant, ces informations n'avaient qu'un impact ponctuel et limité. Aujourd'hui, elles deviennent de plus en plus dangereuses lorsqu'elles sont intégrées aux données d'entrée des systèmes d'intelligence artificielle (IA). Lors de la recherche et de la collecte d'informations pour répondre aux utilisateurs, des systèmes tels que les chatbots et les assistants virtuels sont tout à fait capables d'utiliser, de créer ou de diffuser de fausses informations s'ils ne disposent pas de la capacité d'auto-vérification », a déclaré un représentant de Viettel.

La vérification des faits consiste à vérifier la véracité ou la fausseté d'une information. Par exemple, l'objectif de la vérification des faits concernant l'affirmation « La NASA a découvert de la vie sur Mars » est de vérifier si l'information est fondée sur des faits publiés, notamment auprès de sources fiables telles que des journaux, des données scientifiques ou des bases de connaissances. Pour auto-vérifier l'information, les systèmes d'IA doivent être capables de comprendre l'affirmation, de trouver les informations pertinentes et de tirer des conclusions logiques à partir de données objectives.

VeGraph (Verify-in-the-Graph) est une méthode de vérification d'informations étudiée, développée et présentée par une équipe d'ingénieurs du Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) lors de la NAACL 2025, l'une des trois conférences internationales les plus prestigieuses sur le traitement du langage naturel. Les résultats expérimentaux obtenus sur deux jeux de données de vérification populaires, HoVer et FEVEROUS, montrent que VeGraph améliore la précision de 2 à 5 % par rapport aux méthodes existantes.

Selon les experts en IA de Viettel, la plupart des méthodes actuelles de vérification de l'information peinent encore à traiter les déclarations ambiguës, métaphoriques ou complexes, souvent utilisées pour « déguiser » de fausses informations. De plus, elles ne peuvent pas expliquer clairement pourquoi un contenu est considéré comme faux, ce qui rend les résultats difficiles à croire pour les utilisateurs. De plus, de nombreuses méthodes reposent principalement sur de grands modèles linguistiques (LLM), sans possibilité de recoupement avec les sources de connaissances officielles, ce qui entraîne le risque de fausses conclusions, également appelées « hallucinations ».

Contrairement aux outils qui se contentent d'effectuer des inférences internes au modèle, VeGraph décompose proactivement la demande de vérification des informations en petites clauses, puis la compare à des références fiables telles que des documents juridiques, des bases de données gouvernementales , des documents spécialisés, etc. L'ensemble du processus de vérification est systématisé en étapes claires, ce qui facilite le suivi et la vérification par les utilisateurs, améliorant ainsi la précision et la transparence, facteurs de plus en plus importants dans les applications d'IA. Cette fonctionnalité permet également aux organisations d'ajuster et d'améliorer rapidement le système en cas de besoin.

Visant un environnement numérique transparent et sécurisé, VeGraph est très apprécié pour ses applications pratiques. Outre sa capacité à s'intégrer aux systèmes d'IA pour accroître la précision et la fiabilité, cette technologie peut être développée pour devenir un système de vérification d'informations dans de nombreux domaines tels que la santé, le journalisme, le droit ou la gestion publique. Grâce à cela, les utilisateurs peuvent auto-vérifier des informations importantes exigeant une grande authenticité, comme l'actualité, les informations sur les médicaments, les vaccins, les produits pharmaceutiques ou les réglementations légales.

À l’avenir, VeGraph sera étendu pour gérer divers formats de données tels que des images, des vidéos, de l’audio, etc., reconnaître des formes de langage complexes telles que des métaphores, des implications et intégrer des graphiques de connaissances pour améliorer les capacités de raisonnement.

Cette année, NAACL 2025 a attiré un nombre record d'articles, dépassant les 3 000, avec un taux d'acceptation très compétitif pour les articles principaux (environ 22 %), réunissant les recherches les plus innovantes. NAACL 2025 se concentre spécifiquement sur les avancées majeures dans le développement de modèles linguistiques à grande échelle, le traitement du langage naturel interculturel et multilingue, les capacités d'inférence émergentes et l'IA responsable.

Selon le journal News and People

Source : https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067