VeGraph verbessert die Genauigkeit im Vergleich zu bestehenden Methoden um 2 – 5 %.
NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) ist das weltweit führende renommierte wissenschaftliche Forum auf dem Gebiet der natürlichen Sprachverarbeitung und Computerlinguistik.
Nach Angaben von Viettel vom Nachmittag des 16. Mai hat die explosionsartige Verbreitung des Internets und der sozialen Netzwerke dazu geführt, dass benutzergenerierte Inhalte immer beliebter werden. Gleichzeitig führt dies zu einer Welle von Falschmeldungen und inoffiziellen Nachrichten, die sich weit verbreiten. Diese Falschinformationen verwirren nicht nur die Menschen in sensiblen Bereichen wie Gesundheit, Naturkatastrophen, öffentliche Ordnung usw., sondern führen auch zu schwerwiegenden Konsequenzen wie etwa wirtschaftlichen Schäden, einem Verlust des Rufs der Organisation und einer Bedrohung der nationalen Sicherheit.
„Früher hatten diese Informationen nur eine begrenzte Wirkung und einen begrenzten Umfang. Jetzt werden sie immer gefährlicher, wenn sie Teil der Eingabedaten für Systeme der künstlichen Intelligenz (KI) werden. Systeme wie Chatbots und virtuelle Assistenten können bei der Suche und Sammlung von Informationen zur Beantwortung von Nutzeranfragen durchaus falsche Informationen verwenden, erstellen oder verbreiten, wenn sie nicht über die Fähigkeit zur Selbstverifizierung verfügen“, sagte ein Vertreter von Viettel.
Beim Faktencheck handelt es sich um den Prozess der Überprüfung der Wahrheit oder Falschheit einer Information. Ist es beispielsweise das Ziel der Überprüfung der Aussage „Die NASA hat Leben auf dem Mars gefunden“, zu prüfen, ob diese Information auf veröffentlichten Fakten beruht? durch zuverlässige Quellen wie Zeitungen, wissenschaftliche Daten oder Wissensdatenbanken. Um Informationen selbst zu verifizieren, müssen KI-Systeme in der Lage sein, Sätze zu verstehen, relevante Informationen zu finden und auf der Grundlage objektiver Daten logische Schlussfolgerungen zu ziehen.
VeGraph (Verify-in-the-Graph) ist eine Methode zur Informationsüberprüfung, die von einem Team von Ingenieuren bei Viettel Data Services and Artificial Intelligence Center (Viettel AI) auf der NAACL 2025 – einer der drei renommiertesten internationalen Konferenzen zur Verarbeitung natürlicher Sprache – erforscht, entwickelt und vorgestellt wurde. Experimentelle Ergebnisse mit zwei beliebten Validierungsdatensätzen, HoVer und FEVEROUS, zeigen, dass VeGraph die Genauigkeit im Vergleich zu bestehenden Methoden um 2 – 5 % verbessert.
Laut den KI-Experten von Viettel haben die meisten aktuellen Methoden zur Informationsüberprüfung immer noch Schwierigkeiten mit mehrdeutigen, metaphorischen oder vielschichtigen Aussagen, die oft verwendet werden, um falsche Informationen zu „tarnen“. Gleichzeitig ist es nicht möglich, klar zu erklären, warum ein Inhalt als falsch eingestuft wird, was es für die Nutzer schwierig macht, den Ergebnissen zu vertrauen. Viele Methoden basieren zudem stark auf großen Sprachmodellen (LLMs), denen die Möglichkeit eines Abgleichs mit maßgeblichen Wissensquellen fehlt. Dadurch besteht die Gefahr, dass falsche Schlussfolgerungen gezogen werden, die auch als „Halluzination“ bezeichnet werden.
Im Gegensatz zu Tools, die nur interne Schlussfolgerungen innerhalb des Modells ziehen, zerlegt VeGraph die Informationsüberprüfungsanfrage proaktiv in kleine Vorschläge und vergleicht sie dann mit zuverlässigen Referenzen wie Rechtsdokumenten, Regierungsdatenbanken , Fachdokumenten usw. Der gesamte Überprüfungsprozess ist in klare Schritte systematisiert, sodass Benutzer ihn leicht verfolgen und überprüfen können, was die Genauigkeit und Transparenz erhöht – Faktoren, die bei KI-Anwendungen immer wichtiger werden. Diese Funktion ermöglicht es Organisationen außerdem, das System bei Bedarf schnell anzupassen und zu verbessern.
VeGraph zielt auf eine transparente und sichere digitale Umgebung ab und wird für seine praktische Anwendung sehr geschätzt. Neben der Möglichkeit, diese Technologie in KI-Systeme zu integrieren, um die Genauigkeit und Zuverlässigkeit zu erhöhen, kann sie auch zu einem Informationsüberprüfungssystem in vielen Bereichen wie Medizin, Journalismus, Recht oder Staatsverwaltung weiterentwickelt werden. Dadurch können Menschen wichtige Informationen, die eine hohe Authentizität erfordern, wie etwa aktuelle Nachrichten, Informationen über Medikamente, Impfstoffe, Arzneimittel oder gesetzliche Bestimmungen, selbst überprüfen.
In Zukunft wird VeGraph erweitert, um verschiedene Datenformate wie Bilder, Videos, Audio usw. zu verarbeiten, komplexe Sprachformen wie Metaphern und Implikationen zu erkennen und Wissensgraphen einzubinden, um die Denkfähigkeiten zu verbessern.
In diesem Jahr konnte NAACL 2025 eine Rekordzahl von über 3.000 Forschungsarbeiten verzeichnen, wobei die Annahmequote für die Hauptarbeiten (ca. 22 %) sehr hoch war und die bahnbrechendsten Forschungsergebnisse zusammengetragen wurden. NAACL 2025 konzentriert sich insbesondere auf bahnbrechende Fortschritte bei der Entwicklung großer Sprachmodelle, der interkulturellen und mehrsprachigen Verarbeitung natürlicher Sprache, neuen Inferenzfähigkeiten und verantwortungsvoller KI.
Laut News and People Zeitung
Quelle: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Kommentar (0)