
(Abbildung zur Veranschaulichung)
Künstliche Intelligenz wird von vielen Menschen zur Informationsbeschaffung und Ideengenerierung eingesetzt, doch im Bereich der Faktenprüfung weisen diese Werkzeuge noch immer viele besorgniserregende Einschränkungen auf.
Laut einem Artikel auf WIRED nutzen fast die Hälfte der Amerikaner KI, um Informationen zu finden und Ideen zu generieren. Angesichts der zunehmenden Menge an minderwertigen Inhalten in sozialen Medien und der Tatsache, dass Suchmaschinen es vielen erschweren, verlässliche Quellen zu finden, ist dies verständlich. Geht es jedoch um die Wahrheit, sind die Risiken durch Fehlinformationen weitaus größer.
Der Autor des Artikels, ein Faktenchecker bei WIRED, argumentiert, dass KI die menschliche Faktenprüfung noch nicht ersetzen kann. Diese Arbeit umfasst mehr als nur die Internetrecherche; sie beinhaltet auch Querverweise, die Priorisierung von Quellen, die Überprüfung von Annahmen, die Identifizierung widersprüchlicher Informationen, die Kontaktaufnahme mit Quellen und die Bewertung ethischer und rechtlicher Fragen.
Künstliche Intelligenz (KI) wird mittlerweile vermehrt zur Faktenprüfung eingesetzt, nachdem Informationen veröffentlicht wurden. In Großbritannien hat die Organisation Full Fact KI-Tools entwickelt, um große Datenmengen – von Social-Media-Posts bis hin zu Podcast-Aufnahmen – zu verarbeiten und so Behauptungen zu identifizieren, die einer weiteren menschlichen Überprüfung bedürfen. Mark Frankel, Leiter der Abteilung für öffentliche Angelegenheiten bei Full Fact, betont jedoch, dass dieser Prozess weiterhin menschliches Eingreifen erfordert.
Der Hauptgrund dafür ist, dass KI noch immer häufig falsche Antworten liefert. Eine Studie des Tow Centre for Digital Journalism aus dem März 2025 ergab, dass über 60 % der Antworten von KI-gestützten Suchmaschinen ungenau sind. Eine Studie der BBC deutete zudem darauf hin, dass die Fehlerrate von Chatbots bei rund 45 % liegt.

Die Website und das Logo von Anthropic werden am 26. Februar 2026 auf einem Computerbildschirm in New York, USA, angezeigt. (Foto: AP)
Auch spezielle Tests lieferten verhaltene Ergebnisse. Im RealFactBench, einem von Informatikern in China und Großbritannien entwickelten Benchmark für Faktenchecks, erreichte Claude eine Genauigkeit von 73 % über alle Indikatoren hinweg. Der SimpleQA-Test von OpenAI zeigte hingegen, dass keines der Modelle von OpenAI oder Anthropic bei über 4.000 Fragen mit nur einer Antwortmöglichkeit eine Genauigkeit von über 50 % erreichte.
Der Autor versuchte außerdem, ChatGPT, Claude, Gemini und Grok einem Verifizierungstest zu unterziehen. Die Modelle konnten Arbeitspläne entwerfen, rechtliche Risiken identifizieren oder Verifizierungsmethoden vorschlagen, gingen aber nicht so weit, die Fakten tatsächlich zu überprüfen.
Der Artikel argumentiert, dass menschliche Stärken darin liegen, Informationen zu verarbeiten, die nicht ohne Weiteres im Internet verfügbar sind, Nuancen in der Kommunikation zu erkennen, die Zusammenhänge zwischen Quellen zu bewerten und in heiklen Situationen Fragen zu stellen. Daher kann KI ein hilfreiches Werkzeug sein, doch die Faktenprüfung erfordert weiterhin menschliche Vorsicht, Erfahrung und Verantwortungsbewusstsein.
Quelle: https://vtv.vn/ai-van-kho-thay-con-nguoi-trong-kiem-chung-thong-tin-10026052717475078.htm








Kommentar (0)