
(Ілюстративне зображення)
Штучний інтелект використовується багатьма людьми для пошуку інформації та генерування ідей, але в галузі перевірки фактів ці інструменти все ще мають багато тривожних обмежень.
Згідно зі статтею на WIRED, майже половина американців кажуть, що використовують штучний інтелект для пошуку інформації та генерування ідей. Це зрозуміло, враховуючи зростання кількості низькоякісного контенту в соціальних мережах, а пошукові системи також ускладнюють для багатьох пошук надійних джерел. Однак, коли йдеться про правду, ризики від дезінформації набагато більші.
Автор статті, фактчекер у WIRED, стверджує, що штучний інтелект поки що не може замінити процеси перевірки фактів людиною. Ця робота включає не лише пошук в інтернеті; вона також включає перехресні посилання, визначення пріоритетів джерел, перевірку припущень, виявлення суперечливої інформації, контакт із джерелами та оцінку етичних та правових питань.
Штучний інтелект зараз частіше використовується для перевірки фактів після публікації інформації. У Великій Британії організація Full Fact розробила інструменти штучного інтелекту для обробки великих обсягів даних, від публікацій у соціальних мережах до записів подкастів, тим самим виявляючи твердження, які потребують подальшого людського розслідування. Однак Марк Франкель, керівник відділу державної політики Full Fact, наголошує, що цей процес все ще вимагає втручання людини.
Основна причина полягає в тому, що штучний інтелект все ще часто дає неправильні відповіді. Дослідження Центру цифрової журналістики Tow, проведене в березні 2025 року, показало, що понад 60% відповідей пошукових систем, інтегрованих зі штучним інтелектом, є неточними. Дослідження BBC також показало, що рівень помилок для чат-ботів становить близько 45%.

Вебсайт та логотип Anthropic відображаються на екрані комп’ютера в Нью-Йорку, США, 26 лютого 2026 року. (Фото: AP)
Спеціалізовані тести також дали обережні результати. У RealFactBench, бенчмарку для перевірки фактів, розробленому комп'ютерними вченими в Китаї та Великій Британії, Клод досяг 73% точності за всіма показниками. Тим часом SimpleQA від OpenAI показав, що жодна з моделей OpenAI чи Anthropic не перевищила 50% точності на понад 4000 питань з однією відповіддю.
Автор також спробував застосувати верифікаційний тест до ChatGPT, Claude, Gemini та Grok. Моделі могли окреслювати робочі плани, визначати юридичні ризики або пропонувати методи перевірки, але всі вони не доводили до фактичної перевірки фактів.
У статті стверджується, що людські сильні сторони полягають у здатності обробляти інформацію, яка не є легкодоступною в Інтернеті, розпізнавати нюанси в комунікації, оцінювати зв'язки між джерелами та ставити запитання в делікатних ситуаціях. Тому штучний інтелект може бути корисним інструментом, але перевірка фактів все ще вимагає людської обережності, досвіду та відповідальності.
Джерело: https://vtv.vn/ai-van-kho-thay-con-nguoi-trong-kiem-chung-thong-tin-10026052717475078.htm








Коментар (0)