Yapay zekâ, bilgilerin doğrulanmasında insanları tamamen yerini almakta hâlâ zorlanıyor.

(Örnek görsel)

Yapay zekâ, bilgi edinme ve fikir üretme amacıyla birçok kişi tarafından kullanılıyor, ancak doğruluk kontrolü alanında bu araçlar hâlâ birçok endişe verici sınırlama ortaya koyuyor.

WIRED'da yayınlanan bir makaleye göre, Amerikalıların neredeyse yarısı bilgi bulmak ve fikir üretmek için yapay zekayı kullandığını söylüyor. Sosyal medyada düşük kaliteli içeriğin artması ve arama motorlarının birçok kişi için güvenilir kaynak bulmayı zorlaştırması göz önüne alındığında bu anlaşılabilir bir durum. Ancak, gerçek söz konusu olduğunda, yanlış bilgilendirmeden kaynaklanan riskler çok daha büyüktür.

Makalenin yazarı, WIRED'da doğruluk kontrolcüsü olarak çalışan bir kişi, yapay zekanın henüz insan doğruluk kontrol süreçlerinin yerini alamayacağını savunuyor. Bu çalışma sadece internette arama yapmaktan ibaret değil; aynı zamanda çapraz referanslama, kaynakları önceliklendirme, varsayımları kontrol etme, çelişkili bilgileri belirleme, kaynaklarla iletişime geçme ve etik ve yasal sorunları değerlendirme gibi süreçleri de içeriyor.

Yapay zekâ, artık bilgi yayınlandıktan sonra doğruluk kontrolünde daha fazla kullanılıyor. İngiltere'de Full Fact adlı kuruluş, sosyal medya paylaşımlarından podcast kayıtlarına kadar büyük veri hacimlerini işlemek ve daha fazla insan incelemesi gerektiren iddiaları belirlemek için yapay zekâ araçları geliştirdi. Ancak Full Fact'in kamu politikaları başkanı Mark Frankel, bu sürecin hala insan müdahalesi gerektirdiğini vurguluyor.

Bunun temel nedeni, yapay zekanın hala sıklıkla yanlış cevaplar vermesidir. Tow Dijital Gazetecilik Merkezi'nin Mart 2025'te yaptığı bir araştırmaya göre, yapay zeka entegre arama motorlarından gelen yanıtların %60'ından fazlası hatalıdır. BBC'nin bir araştırması da sohbet botlarının hata oranının yaklaşık %45 olduğunu öne sürmüştür.

AI vẫn khó thay con người trong kiểm chứng thông tin - Ảnh 1. — Anthropic'in internet sitesi ve logosu, 26 Şubat 2026'da ABD'nin New York şehrinde bir bilgisayar ekranında görüntüleniyor. (Fotoğraf: AP)

Özel testler de temkinli sonuçlar verdi. Çin ve İngiltere'deki bilgisayar bilimcileri tarafından geliştirilen bir doğruluk kontrolü kıyaslama aracı olan RealFactBench'te Claude, tüm göstergelerde %73 doğruluk oranına ulaştı. Öte yandan, OpenAI'nin SimpleQA'sı, OpenAI veya Anthropic'in modellerinin hiçbirinin 4.000'den fazla tek cevaplı soruda %50'nin üzerinde doğruluk oranına ulaşamadığını gösterdi.

Yazar ayrıca ChatGPT, Claude, Gemini ve Grok'a bir doğrulama testi uygulamaya çalıştı. Modeller çalışma planlarını özetleyebilir, yasal riskleri belirleyebilir veya doğrulama yöntemleri önerebilir, ancak gerçekleri doğrulama aşamasından geri kaldılar.

Makale, insan güçlü yönlerinin internette kolayca bulunmayan bilgileri işleme, iletişimdeki incelikleri tanıma, kaynaklar arasındaki ilişkileri değerlendirme ve hassas durumlarda soru sorma yeteneğinde yattığını savunuyor. Bu nedenle, yapay zeka faydalı bir araç olabilir, ancak gerçekleri kontrol etmek yine de insan dikkatine, deneyimine ve sorumluluğuna ihtiyaç duyar.

Kaynak: https://vtv.vn/ai-van-kho-thay-con-nguoi-trong-kiem-chung-thong-tin-10026052717475078.htm