Sztuczna inteligencja wciąż ma problemy z zastąpieniem ludzi w weryfikacji informacji.

(Ilustracja)

Wiele osób korzysta ze sztucznej inteligencji w celu wyszukiwania informacji i generowania pomysłów, ale w dziedzinie weryfikacji faktów narzędzia te wciąż wykazują wiele niepokojących ograniczeń.

Według artykułu w WIRED, prawie połowa Amerykanów twierdzi, że korzysta ze sztucznej inteligencji do wyszukiwania informacji i generowania pomysłów. Jest to zrozumiałe, biorąc pod uwagę rosnącą ilość treści niskiej jakości w mediach społecznościowych, a wyszukiwarki utrudniają wielu osobom znalezienie wiarygodnych źródeł. Jednak w kwestii prawdy ryzyko związane z dezinformacją jest znacznie większe.

Autor artykułu, fact-checker w WIRED, argumentuje, że sztuczna inteligencja nie jest jeszcze w stanie zastąpić ludzkich procesów weryfikacji faktów. Praca ta obejmuje nie tylko przeszukiwanie internetu; obejmuje również odsyłanie do źródeł, priorytetyzację źródeł, weryfikację założeń, identyfikację sprzecznych informacji, kontakt ze źródłami oraz ocenę kwestii etycznych i prawnych.

Sztuczna inteligencja jest obecnie coraz częściej wykorzystywana do weryfikacji faktów po ich opublikowaniu. W Wielkiej Brytanii organizacja Full Fact opracowała narzędzia oparte na sztucznej inteligencji do przetwarzania dużych ilości danych, od postów w mediach społecznościowych po nagrania podcastów, identyfikując w ten sposób twierdzenia wymagające dalszej analizy. Mark Frankel, dyrektor ds. polityki publicznej w Full Fact, podkreśla jednak, że proces ten nadal wymaga ingerencji człowieka.

Głównym powodem jest to, że sztuczna inteligencja nadal często udziela niepoprawnych odpowiedzi. Badanie przeprowadzone w marcu 2025 roku przez Tow Centre for Digital Journalism wykazało, że ponad 60% odpowiedzi z wyszukiwarek zintegrowanych ze sztuczną inteligencją jest nieprecyzyjnych. Badanie BBC sugeruje również, że wskaźnik błędów w przypadku chatbotów wynosi około 45%.

AI vẫn khó thay con người trong kiểm chứng thông tin - Ảnh 1. — Strona internetowa i logo Anthropic wyświetlane na ekranie komputera w Nowym Jorku, USA, 26 lutego 2026 r. (Zdjęcie: AP)

Specjalistyczne testy również przyniosły ostrożne wyniki. W RealFactBench, benchmarku weryfikacji faktów opracowanym przez informatyków z Chin i Wielkiej Brytanii, Claude osiągnął 73% dokładności we wszystkich wskaźnikach. Z kolei SimpleQA firmy OpenAI wykazało, że żaden z modeli OpenAI ani Anthropic nie przekroczył 50% dokładności w ponad 4000 pytań jednokrotnych.

Autor podjął również próbę zastosowania testu weryfikacyjnego w ChatGPT, Claude, Gemini i Grok. Modele mogły nakreślić plany pracy, zidentyfikować ryzyka prawne lub zasugerować metody weryfikacji, ale żaden z nich nie zdołał zweryfikować faktów.

W artykule autorzy dowodzą, że ludzkie atuty tkwią w zdolności przetwarzania informacji trudno dostępnych w internecie, rozpoznawania niuansów w komunikacji, oceny relacji między źródłami oraz zadawania pytań w sytuacjach newralgicznych. Dlatego sztuczna inteligencja może być pomocnym narzędziem, ale weryfikacja faktów nadal wymaga od człowieka ostrożności, doświadczenia i odpowiedzialności.

Source: https://vtv.vn/ai-van-kho-thay-con-nguoi-trong-kiem-chung-thong-tin-10026052717475078.htm