En gruppe forskere i Tyskland kom nylig med en advarsel om potensialet for skjevhet ved bruk av AI-chatboter for å forkorte forskningsinnhold. Etter å ha analysert 4900 menneskeskrevne vitenskapelige sammendrag, brukte gruppen ulike AI-modeller for å sammenligne hvordan disse systemene behandlet informasjon. Resultatene viste at de fleste chatboter gjorde feilen å overgeneralisere, selv når de ble bedt om å oppsummere nøyaktig.
ChatGPT og DeepSeek forvrenger vitenskapelige data.
AI-modeller som ChatGPT og DeepSeek har vist seg å kunne forvrenge vitenskapelig innhold når det oppsummeres, spesielt innen det medisinske feltet.
AI kan lett forvrenge innholdet når man oppsummerer vitenskapelig forskning.
I eksperimentene gjorde AI-modeller fem ganger flere feil enn menneskelige forskere når de ikke ble veiledet. Selv med klare krav til nøyaktighet var feilraten fortsatt dobbelt så høy som med et standard sammendrag. Et medlem av forskerteamet kommenterte: «Generalisering kan virke harmløs til tider, men det endrer faktisk den opprinnelige forskningens natur. Det er en systemisk skjevhet.»
Det er verdt å merke seg at nyere versjoner av chatboter ikke bare ikke klarer å løse problemet, men faktisk forverrer det. Med sin smidige og engasjerende levering gir AI-genererte sammendrag lett inntrykk av pålitelighet, mens det faktiske innholdet er forvrengt. I ett tilfelle endret DeepSeek uttrykket «trygt og vellykket implementerbart» til «trygt og effektiv behandling» – en tolkning som avvek fra studiens opprinnelige konklusjoner.
I et annet eksempel anvendte Llama-modellen anbefalinger for diabetesmedisiner til unge personer uten å spesifisere dosering, hyppighet eller bivirkninger. Hvis leseren, en lege eller helsepersonell , ikke verifiserer mot den opprinnelige studien, kan denne typen sammendrag utgjøre en direkte fare for pasientene.
Eksperter mener dette fenomenet stammer fra måten AI-modeller trenes på. Mange nåværende chatboter trenes ved hjelp av sekundærdata – som masseproduserte vitenskapelige nyheter – som allerede er forenklet. Etter hvert som AI-en fortsetter å oppsummere dette forenklede innholdet, øker risikoen for forvrengning.
KI-eksperter innen psykisk helse hevder at tekniske barrierer for utvikling og bruk av KI må etableres snart.
Brukere bør være forsiktige, da chatboter lett kan forvrenge innhold.
Ettersom brukere i økende grad er avhengige av AI-chatboter for å lære vitenskapelig informasjon, kan små unøyaktigheter i tolkningen raskt hope seg opp og spre seg, noe som fører til utbredte misoppfatninger. I en tid der tilliten til vitenskapen synker, er denne risikoen spesielt bekymringsfull og krever behørig oppmerksomhet.
Integrering av kunstig intelligens i forskning og kunnskapsformidling er en irreversibel trend. Eksperter hevder imidlertid at teknologi ikke kan erstatte menneskers rolle i å forstå og verifisere vitenskapelig innhold. Når man bruker chatboter i høyrisikofelt som helsevesen, må nøyaktighet prioriteres, snarere enn å fokusere utelukkende på smidig språkopplevelse eller responshastighet.
Kilde: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html


Klasserom på West Island (Spratlyøyene)

Det vakre ved å tjene til livets opphold på lagunene i den gamle hovedstaden Hue.





