Wanneer AI de waarheid weet te verifiëren: nieuwe vooruitgang van Viettel AI op NAACL 2025

Fotobijschrift

VeGraph verbetert de nauwkeurigheid met 2 - 5% ten opzichte van bestaande methoden.

NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) is 's werelds belangrijkste prestigieuze wetenschappelijke forum op het gebied van natuurlijke taalverwerking en computationele linguïstiek.

Volgens informatie van Viettel op de middag van 16 mei heeft de explosie van internet en sociale netwerken ervoor gezorgd dat door gebruikers gegenereerde content steeds populairder is geworden; tegelijkertijd heeft het geleid tot een golf van nepnieuws en onofficieel nieuws die zich wijd verspreidt. Deze valse informatie veroorzaakt niet alleen verwarring bij mensen in gevoelige sectoren zoals gezondheid, natuurrampen, overheidsbeleid..., maar heeft ook ernstige gevolgen, zoals economische schade, een slechte reputatie van organisaties en een bedreiging voor de nationale veiligheid.

"Vroeger had deze informatie alleen impact op een bepaald moment en in een bepaalde omvang, maar het wordt steeds gevaarlijker wanneer het deel uitmaakt van de invoergegevens voor systemen met kunstmatige intelligentie (AI). Bij het zoeken en verzamelen van informatie om gebruikers te antwoorden, zijn systemen zoals chatbots en virtuele assistenten volledig in staat om valse informatie te gebruiken, te creëren of te verspreiden als ze niet in staat zijn om zichzelf te verifiëren", aldus een vertegenwoordiger van Viettel.

Factchecken is het proces waarbij de juistheid of onjuistheid van een stukje informatie wordt geverifieerd. Het doel van het controleren van de bewering "NASA heeft leven gevonden op Mars" is bijvoorbeeld om te controleren of de informatie gebaseerd is op gepubliceerde feiten, bijvoorbeeld via betrouwbare bronnen zoals kranten, wetenschappelijke gegevens of kennisbanken. Om informatie zelf te verifiëren, moeten AI-systemen de zin kunnen begrijpen, relevante informatie kunnen vinden en logische conclusies kunnen trekken op basis van objectieve gegevens.

VeGraph (Verify-in-the-Graph) is een methode voor informatieverificatie die is onderzocht, ontwikkeld en gepresenteerd door een team van ingenieurs van Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) tijdens NAACL 2025, een van de drie meest prestigieuze internationale conferenties over natuurlijke taalverwerking. Experimentele resultaten met twee populaire verificatiedatasets, HoVer en FEVEROUS, tonen aan dat VeGraph de nauwkeurigheid met 2-5% verbetert ten opzichte van bestaande methoden.

Volgens de AI-experts van Viettel hebben de meeste huidige methoden voor informatieverificatie nog steeds moeite met dubbelzinnige, metaforische of gelaagde beweringen, die vaak worden gebruikt om valse informatie te "verhullen". Tegelijkertijd kunnen ze niet duidelijk uitleggen waarom een stuk content als vals wordt beschouwd, waardoor het voor gebruikers moeilijk is om de resultaten te vertrouwen. Veel methoden vertrouwen bovendien voornamelijk op grote taalmodellen (LLM) zonder de mogelijkheid om deze te vergelijken met officiële kennisbronnen, wat leidt tot het risico op valse conclusies of het zogenaamde "hallucinatie"-fenomeen.

In tegenstelling tot tools die alleen interne conclusies binnen het model trekken, splitst VeGraph proactief het verzoek om informatieverificatie op in kleine clausules en vergelijkt deze vervolgens met betrouwbare referenties zoals juridische documenten, overheidsdatabases , gespecialiseerde documenten, enz. Het volledige verificatieproces is gesystematiseerd in duidelijke stappen, waardoor gebruikers het gemakkelijk kunnen monitoren en controleren. Dit verhoogt de nauwkeurigheid en transparantie – een steeds belangrijkere factor in AI-toepassingen. Deze functionaliteit stelt organisaties ook in staat om het systeem snel aan te passen en te verbeteren wanneer dat nodig is.

VeGraph streeft naar een transparante en veilige digitale omgeving en wordt zeer gewaardeerd om zijn praktische toepassing. Naast de mogelijkheid om te integreren in AI-systemen om de nauwkeurigheid en betrouwbaarheid te verhogen, kan deze technologie worden ontwikkeld tot een informatieverificatiesysteem in vele sectoren, zoals gezondheidszorg, journalistiek, recht of overheidsbeheer. Hierdoor kunnen mensen belangrijke informatie die een hoge mate van authenticiteit vereist, zelf verifiëren, zoals actueel nieuws, informatie over medicijnen, vaccins, farmaceutische producten of wettelijke voorschriften.

In de toekomst zal VeGraph worden uitgebreid om uiteenlopende dataformaten te kunnen verwerken, zoals afbeeldingen, video's, audio, etc., complexe taalvormen zoals metaforen en implicaties te herkennen en extra kennisgrafieken op te nemen om het redeneervermogen te verbeteren.

Dit jaar trok NAACL 2025 een recordaantal artikelen aan, meer dan 3.000, met een zeer competitief acceptatiepercentage voor primaire artikelen (ongeveer 22%), waardoor het meest baanbrekende onderzoek bijeenkwam. NAACL 2025 richt zich specifiek op baanbrekende ontwikkelingen in de ontwikkeling van grote taalmodellen, interculturele en meertalige natuurlijke taalverwerking, opkomende inferentiemogelijkheden en verantwoorde AI.

Volgens de krant News and People

Bron: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067