En gruppe forskere i Tyskland udsendte for nylig en advarsel om potentialet for bias i brugen af AI-chatbots til at forkorte forskningsindhold. Efter at have analyseret 4.900 menneskeskrevne videnskabelige abstracts brugte gruppen forskellige AI-modeller til at sammenligne, hvordan disse systemer behandlede information. Resultaterne viste, at de fleste chatbots begik fejlen at overgeneralisere, selv når de blev bedt om at opsummere præcist.
ChatGPT og DeepSeek forvrænger videnskabelige data.
AI-modeller som ChatGPT og DeepSeek har vist sig at være i stand til at forvrænge videnskabeligt indhold, når det opsummeres, især inden for det medicinske område.
AI kan nemt forvrænge indholdet, når videnskabelig forskning opsummeres.
I eksperimenterne lavede AI-modeller fem gange flere fejl end menneskelige forskere, når de ikke blev vejledt. Selv med klare krav til nøjagtighed var fejlprocenten stadig dobbelt så høj som ved et standardresumé. Et medlem af forskerholdet kommenterede: "Generalisering kan til tider virke harmløs, men det ændrer faktisk den oprindelige forskning. Det er en systemisk bias."
Det er værd at bemærke, at nyere versioner af chatbots ikke blot undlader at løse problemet, men faktisk forværrer det. Med deres problemfri og engagerende levering giver AI-genererede resuméer let indtryk af troværdighed, mens det faktiske indhold er forvrænget. I ét tilfælde ændrede DeepSeek udtrykket "sikker og succesfuldt implementerbar" til "sikker og effektiv behandling" - en fortolkning, der afveg fra studiets oprindelige konklusioner.
I et andet eksempel anvendte Llama-modellen anbefalinger for diabetesmedicin til unge forsøgspersoner uden at specificere dosering, hyppighed eller bivirkninger. Hvis læseren, en læge eller et sundhedspersonale , ikke verificerer det mod det oprindelige studie, kan denne type resuméer udgøre en direkte fare for patienterne.
Eksperter mener, at dette fænomen stammer fra den måde, AI-modeller trænes på. Mange nuværende chatbots trænes ved hjælp af sekundære data – såsom masseproducerede videnskabelige nyheder – som allerede er blevet forenklet. Efterhånden som AI'en fortsætter med at opsummere dette forenklede indhold, øges risikoen for forvrængning.
AI-eksperter inden for mental sundhed argumenterer for, at der snart skal etableres tekniske barrierer for udvikling og brug af AI.
Brugere bør være forsigtige, da chatbots nemt kan forvrænge indhold.
Efterhånden som brugerne i stigende grad bruger AI-chatbots til at lære videnskabelig information, kan små unøjagtigheder i fortolkningen hurtigt ophobe sig og sprede sig, hvilket fører til udbredte misforståelser. I en tid, hvor tilliden til videnskaben er faldende, er denne risiko særligt bekymrende og kræver behørig opmærksomhed.
Integrering af kunstig intelligens i forskning og videnformidling er en uigenkaldelig tendens. Eksperter hævder dog, at teknologi ikke kan erstatte menneskers rolle i at forstå og verificere videnskabeligt indhold. Når man bruger chatbots på højrisikoområder som sundhedspleje, skal nøjagtighed prioriteres i stedet for udelukkende at fokusere på en problemfri sprogoplevelse eller responshastighed.
Kilde: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html











