Dans le monde numérique, les utilisateurs ont besoin d'outils pour faciliter l'authentification des informations.
À l'ère du numérique, les réseaux sociaux et les plateformes en ligne sont devenus le principal canal d'accès à l'information pour des dizaines de millions de personnes chaque jour. Cependant, outre leur commodité, la propagation fulgurante de fausses informations est une réalité inquiétante. Dans ce contexte, il devient indispensable de vérifier l'information en comparant et en contrôlant l'exactitude de ce que nous lisons, entendons et partageons.
Face à cette situation, le centre de services de données et d'intelligence artificielle de Viettel a conçu et développé ClaimPKG, une méthode efficace de vérification de l'information, directement applicable en pratique. Cette recherche, qui a surpassé plus de 5 200 études à travers le monde, sera présentée directement à ACL 2025. Cette conférence, l'une des plus importantes au monde dans le domaine du traitement automatique du langage naturel (TALN), affiche un taux d'acceptation des présentations de seulement 37 %. Elle réunit les plus grands experts technologiques de géants tels que Google, Meta, Huawei, IBM, Amazon et Oracle.
ClaimPKG combine un graphe de connaissances et un modèle de langage étendu, améliorant la précision de 9 à 12 % par rapport aux méthodes actuelles lors de tests effectués sur FactKG (un jeu de données de référence très apprécié par la communauté technologique en matière de vérification de l'information). Ce résultat démontre le fort potentiel de ClaimPKG pour améliorer la fiabilité des futurs systèmes d'IA de vérification de l'information.
Lors de la conférence NAACL 2025, le centre de services de données et d'intelligence artificielle Viettel avait déjà attiré l'attention avec VeGraph, une méthode de vérification d'informations basée sur des plateformes de connaissances textuelles telles que des articles, des documents juridiques, etc. VeGraph a enregistré une amélioration de 2 à 5 % de la précision par rapport à d'autres méthodes, mais dans de nombreux cas, notamment si les données textuelles manquent de structure claire, le processus de vérification peut être long et difficile à garantir en termes de cohérence.
Afin d'améliorer la précision et la cohérence, le Centre de services de données et d'intelligence artificielle de Viettel poursuit ses efforts. ClaimPKG est développé selon une approche structurée basée sur les connaissances, utilisant un graphe de connaissances clairement formaté selon le modèle « sujet-relation-objet ».
Les informations à vérifier sont divisées et transformées en un « pseudo-sous-graphe ». Le système extrait ensuite les connaissances pertinentes dans ce graphe, puis le modèle LLM en déduit la conclusion finale. Ce processus contribue à améliorer la précision, la cohérence et la fiabilité de la vérification, tout en réduisant la charge de calcul du modèle LLM.
Les avantages techniques de ClaimPKG constituent également le fondement de son développement pratique. Dans le domaine du journalisme et de la communication, cette technologie peut aider les journalistes et les rédacteurs à détecter les fausses informations et à comparer rapidement et objectivement les sources d'information.
Dans les domaines médical et juridique, cette technologie peut servir d’« assistant de vérification », facilitant la recherche et l’authentification de connaissances spécialisées. De plus, ClaimPKG peut être intégré aux chatbots et aux assistants virtuels, contribuant ainsi à fournir des réponses plus fiables et à éviter les interprétations ambiguës.
La conférence ACL 2025 (Réunion annuelle de l'Association for Computational Linguistics), qui se tiendra du 27 juillet au 1er août à Vienne, en Autriche, est l'un des événements les plus prestigieux et influents au monde dans le domaine du traitement automatique du langage naturel (TALN). Réunissant des milliers de chercheurs, d'ingénieurs et d'experts internationaux, cette conférence est un lieu d'échange privilégié pour partager les dernières avancées en TALN, de l'apprentissage automatique du langage naturel à la traduction automatique, en passant par la synthèse de texte, la réponse automatique aux questions et les enjeux éthiques et d'équité en intelligence artificielle linguistique.
Cette année, le thème principal de la conférence est « Généralisation des modèles de TAL », mettant l’accent sur le développement de modèles capables de s’adapter et de comprendre de nouvelles données, langues ou domaines.
HA LINH
Source : https://nhandan.vn/cong-nghe-tri-tue-nhan-tao-giup-kiem-chung-thong-tin-post898494.html










Comment (0)