Een groep onderzoekers in Duitsland heeft onlangs gewaarschuwd voor mogelijke vertekening bij het gebruik van AI-chatbots om onderzoeksresultaten in te korten. Na analyse van 4900 door mensen geschreven wetenschappelijke samenvattingen, gebruikte de groep verschillende AI-modellen om te vergelijken hoe deze systemen informatie verwerkten. De resultaten toonden aan dat de meeste chatbots de fout maakten van overgeneralisatie, zelfs wanneer ze werden gevraagd om nauwkeurig samen te vatten.
ChatGPT en DeepSeek vertekenen wetenschappelijke gegevens.
Het is gebleken dat AI-modellen zoals ChatGPT en DeepSeek wetenschappelijke inhoud kunnen verdraaien bij het samenvatten ervan, met name op medisch gebied.
Bij het samenvatten van wetenschappelijk onderzoek kan AI de inhoud gemakkelijk verdraaien.
In de experimenten maakten AI-modellen vijf keer zoveel fouten als menselijke onderzoekers wanneer ze geen begeleiding kregen. Zelfs met duidelijke eisen aan nauwkeurigheid was het foutenpercentage nog steeds twee keer zo hoog als bij een standaard samenvatting. Een lid van het onderzoeksteam merkte op: "Generalisatie lijkt soms onschadelijk, maar het verandert in feite de aard van het oorspronkelijke onderzoek. Het is een systematische vertekening."
Opvallend is dat nieuwere versies van chatbots het probleem niet alleen niet aanpakken, maar het zelfs verergeren. Door hun vlotte en aantrekkelijke presentatie wekken door AI gegenereerde samenvattingen gemakkelijk de indruk van betrouwbaarheid, terwijl de werkelijke inhoud wordt verdraaid. In één geval veranderde DeepSeek de zin 'veilig en succesvol implementeerbaar' in 'veilige en effectieve behandeling' – een interpretatie die afweek van de oorspronkelijke conclusies van het onderzoek.
In een ander voorbeeld paste het Llama-model aanbevelingen voor diabetesmedicatie toe op jonge proefpersonen zonder de dosering, frequentie of bijwerkingen te specificeren. Als de lezer, een arts of zorgverlener , de informatie niet controleert aan de hand van het oorspronkelijke onderzoek, kunnen dit soort samenvattingen een direct gevaar voor patiënten opleveren.
Experts denken dat dit fenomeen voortkomt uit de manier waarop AI-modellen worden getraind. Veel huidige chatbots worden getraind met behulp van secundaire data – zoals massaal geproduceerd wetenschappelijk nieuws – die al vereenvoudigd is. Naarmate de AI deze vereenvoudigde inhoud verder samenvat, neemt het risico op vertekening toe.
AI-experts op het gebied van geestelijke gezondheid stellen dat er snel technische belemmeringen moeten worden weggenomen voor de ontwikkeling en het gebruik van AI.
Gebruikers moeten op hun hoede zijn, want chatbots kunnen de inhoud gemakkelijk verdraaien.
Naarmate gebruikers steeds meer vertrouwen op AI-chatbots om wetenschappelijke informatie te leren, kunnen kleine onnauwkeurigheden in de interpretatie zich snel ophopen en verspreiden, wat leidt tot wijdverspreide misvattingen. In een tijd waarin het vertrouwen in de wetenschap afneemt, is dit risico bijzonder zorgwekkend en verdient het de nodige aandacht.
De integratie van AI in onderzoek en kennisverspreiding is een onomkeerbare trend. Experts stellen echter dat technologie de rol van mensen bij het begrijpen en verifiëren van wetenschappelijke inhoud niet kan vervangen. Bij het gebruik van chatbots in risicovolle sectoren zoals de gezondheidszorg moet nauwkeurigheid prioriteit krijgen, in plaats van uitsluitend te focussen op een vloeiende taalbeleving of reactiesnelheid.
Bron: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html









