VeGraph verbessert die Genauigkeit im Vergleich zu bestehenden Methoden um 2 – 5 %.
NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) ist das weltweit führende renommierte wissenschaftliche Forum auf dem Gebiet der natürlichen Sprachverarbeitung und Computerlinguistik.
Nach Angaben von Viettel vom Nachmittag des 16. Mai hat die explosionsartige Verbreitung des Internets und der sozialen Netzwerke dazu geführt, dass nutzergenerierte Inhalte immer beliebter werden. Gleichzeitig hat dies zu einer Welle von Fake News und inoffiziellen Nachrichten geführt, die sich weit verbreitet haben. Diese Falschinformationen stiften nicht nur Verwirrung in sensiblen Bereichen wie Gesundheit, Naturkatastrophen und öffentlicher Ordnung, sondern führen auch zu schwerwiegenden Folgen wie wirtschaftlichen Schäden, einem Rückgang des Ansehens von Organisationen und einer Bedrohung der nationalen Sicherheit.
„Früher hatten diese Informationen nur zu einem bestimmten Zeitpunkt und in einem bestimmten Umfang Auswirkungen. Jetzt werden sie zunehmend gefährlicher, wenn sie Teil der Eingabedaten für Systeme der künstlichen Intelligenz (KI) werden. Bei der Suche und Sammlung von Informationen, um auf Benutzer zu reagieren, sind Systeme wie Chatbots und virtuelle Assistenten durchaus in der Lage, falsche Informationen zu verwenden, zu erstellen oder zu verbreiten, wenn sie nicht über die Fähigkeit zur Selbstverifizierung verfügen“, sagte ein Vertreter von Viettel.
Faktencheck ist der Prozess, bei dem der Wahrheitsgehalt einer Information überprüft wird. Ziel des Faktenchecks der Aussage „Die NASA hat Leben auf dem Mars gefunden“ ist es beispielsweise zu prüfen, ob die Information auf veröffentlichten Fakten basiert – und zwar anhand zuverlässiger Quellen wie Zeitungen, wissenschaftlicher Daten oder Wissensdatenbanken. Um Informationen selbst zu überprüfen, müssen KI-Systeme in der Lage sein, den Satz zu verstehen, relevante Informationen zu finden und auf der Grundlage objektiver Daten logische Schlussfolgerungen zu ziehen.
VeGraph (Verify-in-the-Graph) ist eine Methode zur Informationsverifizierung, die von einem Team von Ingenieuren des Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) erforscht, entwickelt und auf der NAACL 2025 – einer der drei renommiertesten internationalen Konferenzen zur Verarbeitung natürlicher Sprache – vorgestellt wurde. Experimentelle Ergebnisse mit zwei beliebten Verifizierungsdatensätzen, HoVer und FEVEROUS, zeigen, dass VeGraph die Genauigkeit im Vergleich zu bestehenden Methoden um 2 – 5 % verbessert.
Laut den KI-Experten von Viettel haben die meisten aktuellen Methoden zur Informationsüberprüfung immer noch Schwierigkeiten mit mehrdeutigen, metaphorischen oder vielschichtigen Aussagen, die häufig zur „Verschleierung“ gefälschter Informationen verwendet werden. Gleichzeitig können sie nicht klar erklären, warum ein Inhalt als falsch gilt, was es den Nutzern erschwert, den Ergebnissen zu vertrauen. Viele Methoden basieren zudem hauptsächlich auf großen Sprachmodellen (LLM) ohne die Möglichkeit eines Abgleichs mit offiziellen Wissensquellen. Dies birgt das Risiko falscher Schlussfolgerungen oder des sogenannten „Halluzinationsphänomens“.
Im Gegensatz zu Tools, die nur interne Schlussfolgerungen innerhalb des Modells ziehen, zerlegt VeGraph die Informationsüberprüfungsanfrage proaktiv in kleine Klauseln und vergleicht sie anschließend mit zuverlässigen Referenzen wie Rechtsdokumenten, Regierungsdatenbanken , Fachdokumenten usw. Der gesamte Überprüfungsprozess ist in klare Schritte systematisiert, was die Überwachung und Kontrolle für Benutzer erleichtert und die Genauigkeit und Transparenz erhöht – ein zunehmend wichtiger Faktor bei KI-Anwendungen. Diese Funktion ermöglicht es Unternehmen außerdem, das System bei Bedarf schnell anzupassen und zu verbessern.
VeGraph zielt auf eine transparente und sichere digitale Umgebung ab und wird für seine praktische Anwendung hoch geschätzt. Neben der Fähigkeit, sich in KI-Systeme zu integrieren, um Genauigkeit und Zuverlässigkeit zu erhöhen, kann diese Technologie zu einem Informationsverifizierungssystem in vielen Bereichen wie Gesundheitswesen, Journalismus, Recht oder Staatsverwaltung weiterentwickelt werden. Dank dessen können Menschen wichtige Informationen, die eine hohe Authentizität erfordern, wie aktuelle Nachrichten, Informationen zu Medikamenten, Impfstoffen, Arzneimitteln oder gesetzlichen Bestimmungen, selbst verifizieren.
In Zukunft wird VeGraph erweitert, um verschiedene Datenformate wie Bilder, Videos, Audio usw. zu verarbeiten, komplexe Sprachformen wie Metaphern und Implikationen zu erkennen und zusätzliche Wissensgraphen einzubinden, um die Argumentationsfähigkeiten zu verbessern.
In diesem Jahr verzeichnete die NAACL 2025 eine Rekordzahl von über 3.000 Beiträgen, wobei die Annahmequote für Erstbeiträge sehr hoch war (ca. 22 %) und die bahnbrechendsten Forschungsergebnisse vereint wurden. Der Schwerpunkt der NAACL 2025 liegt insbesondere auf bahnbrechenden Fortschritten in der Entwicklung großer Sprachmodelle, der interkulturellen und mehrsprachigen Verarbeitung natürlicher Sprache, neuen Inferenzfähigkeiten und verantwortungsvoller KI.
Laut News and People Zeitung
Quelle: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Kommentar (0)