VeGraph verbessert die Genauigkeit im Vergleich zu bestehenden Methoden um 2 – 5 %.
NAACL 2025 (Annual Conference of the Nations of the Americas Chapter of the Association for Computational Linguistics) ist das weltweit führende renommierte wissenschaftliche Forum im Bereich der natürlichen Sprachverarbeitung und Computerlinguistik.
Laut Informationen von Viettel vom Nachmittag des 16. Mai hat die explosionsartige Verbreitung des Internets und der sozialen Netzwerke nutzergenerierte Inhalte immer beliebter gemacht; gleichzeitig hat sie zu einer Welle von Fake News und inoffiziellen Nachrichten geführt, die sich weit verbreitet haben. Diese Falschinformationen sorgen nicht nur für Verwirrung in sensiblen Bereichen wie Gesundheit, Naturkatastrophen, öffentliche Ordnung usw., sondern führen auch zu schwerwiegenden Folgen wie wirtschaftlichen Verlusten, einem Ansehensverlust von Organisationen und Bedrohungen der nationalen Sicherheit.
„Früher hatten diese Informationen nur eine begrenzte Wirkung und einen begrenzten Umfang. Jetzt werden sie immer gefährlicher, wenn sie Teil der Eingabedaten für Systeme der künstlichen Intelligenz (KI) werden. Systeme wie Chatbots und virtuelle Assistenten können bei der Suche und Sammlung von Informationen zur Beantwortung von Nutzeranfragen durchaus falsche Informationen verwenden, erstellen oder verbreiten, wenn sie nicht über die Fähigkeit zur Selbstverifizierung verfügen“, sagte ein Vertreter von Viettel.
Faktencheck ist der Prozess, den Wahrheitsgehalt einer Information zu überprüfen. Ziel der Faktenprüfung der Aussage „Die NASA hat Leben auf dem Mars gefunden“ ist es beispielsweise zu prüfen, ob die Information auf veröffentlichten Fakten basiert – anhand zuverlässiger Quellen wie Zeitungen, wissenschaftlichen Daten oder Wissensdatenbanken. Um Informationen selbst zu überprüfen, müssen KI-Systeme in der Lage sein, die Aussage zu verstehen, relevante Informationen zu finden und auf der Grundlage objektiver Daten logische Schlussfolgerungen zu ziehen.
VeGraph (Verify-in-the-Graph) ist eine Methode zur Informationsverifizierung, die von einem Ingenieurteam des Viettel AI Data Services and Artificial Intelligence Center (Viettel AI) erforscht, entwickelt und auf der NAACL 2025 – einer der drei renommiertesten internationalen Konferenzen zur Verarbeitung natürlicher Sprache – vorgestellt wurde. Experimentelle Ergebnisse mit zwei gängigen Verifizierungsdatensätzen, HoVer und FEVEROUS, zeigen, dass VeGraph die Genauigkeit im Vergleich zu bestehenden Methoden um 2 bis 5 % verbessert.
Laut den KI-Experten von Viettel haben die meisten aktuellen Methoden zur Informationsüberprüfung noch immer Schwierigkeiten mit mehrdeutigen, metaphorischen oder vielschichtigen Aussagen, die häufig zur Verschleierung gefälschter Informationen verwendet werden. Gleichzeitig können sie nicht klar erklären, warum ein Inhalt als falsch gilt, was es Nutzern erschwert, den Ergebnissen zu vertrauen. Viele Methoden basieren zudem hauptsächlich auf großen Sprachmodellen (LLM) ohne die Möglichkeit eines Abgleichs mit offiziellen Wissensquellen. Dies birgt das Risiko falscher Schlussfolgerungen, auch bekannt als „Halluzination“.
Im Gegensatz zu Tools, die lediglich interne Schlussfolgerungen innerhalb des Modells ziehen, zerlegt VeGraph die Informationsüberprüfungsanfrage proaktiv in kurze Abschnitte und gleicht diese anschließend mit zuverlässigen Referenzen wie Rechtsdokumenten, behördlichen Datenbanken , Fachdokumenten usw. ab. Der gesamte Überprüfungsprozess ist in klare Schritte systematisiert, was die Überwachung und Überprüfung für Nutzer vereinfacht und Genauigkeit und Transparenz erhöht – Faktoren, die bei KI-Anwendungen zunehmend an Bedeutung gewinnen. Diese Funktion ermöglicht es Unternehmen zudem, das System bei Bedarf schnell anzupassen und zu verbessern.
VeGraph zielt auf eine transparente und sichere digitale Umgebung ab und wird für seine praktische Anwendung hoch geschätzt. Neben der Integration in KI-Systeme zur Erhöhung von Genauigkeit und Zuverlässigkeit kann diese Technologie auch zu einem Informationsverifizierungssystem in vielen Bereichen wie Gesundheitswesen, Journalismus, Recht oder Staatsverwaltung weiterentwickelt werden. Dadurch können Menschen wichtige Informationen, die eine hohe Authentizität erfordern, wie aktuelle Nachrichten, Informationen über Medikamente, Impfstoffe, Arzneimittel oder gesetzliche Bestimmungen, selbst verifizieren.
In Zukunft wird VeGraph erweitert, um verschiedene Datenformate wie Bilder, Videos, Audio usw. zu verarbeiten, komplexe Sprachformen wie Metaphern und Implikationen zu erkennen und Wissensgraphen einzubinden, um die Denkfähigkeiten zu verbessern.
In diesem Jahr verzeichnete die NAACL 2025 eine Rekordzahl von über 3.000 Beiträgen, wobei die Annahmequote für Erstbeiträge (ca. 22 %) sehr hoch war und die bahnbrechendsten Forschungsergebnisse vereinte. Der Schwerpunkt der NAACL 2025 liegt auf bahnbrechenden Fortschritten in der Entwicklung großer Sprachmodelle, der interkulturellen und mehrsprachigen Verarbeitung natürlicher Sprache, neuen Inferenzfähigkeiten und verantwortungsvoller KI.
Laut News and People Zeitung
Quelle: https://doanhnghiepvn.vn/cong-nghe/khi-ai-biet-kiem-chung-su-that-buoc-tien-moi-tu-viettel-ai-tai-naacl-2025/20250519080205067
Kommentar (0)