Un gruppo di ricercatori tedeschi ha recentemente lanciato un allarme sul potenziale di distorsione derivante dall'utilizzo di chatbot basati sull'intelligenza artificiale per sintetizzare i contenuti scientifici. Dopo aver analizzato 4.900 abstract scientifici redatti da esseri umani, il gruppo ha utilizzato diversi modelli di intelligenza artificiale per confrontare il modo in cui questi sistemi elaboravano le informazioni. I risultati hanno mostrato che la maggior parte dei chatbot commetteva l'errore di generalizzare eccessivamente, anche quando sollecitati a riassumere in modo accurato.
ChatGPT e DeepSeek distorcono i dati scientifici.
È stato riscontrato che modelli di intelligenza artificiale come ChatGPT e DeepSeek sono in grado di distorcere i contenuti scientifici durante la loro sintesi, soprattutto in ambito medico.
L'intelligenza artificiale può facilmente distorcere il contenuto quando riassume la ricerca scientifica.
Negli esperimenti, i modelli di intelligenza artificiale hanno commesso cinque volte più errori rispetto ai ricercatori umani quando non erano guidati. Anche con requisiti chiari di accuratezza, il tasso di errore era comunque il doppio rispetto a una sintesi standard. Un membro del team di ricerca ha commentato: "La generalizzazione può sembrare innocua a volte, ma in realtà altera la natura della ricerca originale. Si tratta di un pregiudizio sistemico".
In particolare, le versioni più recenti dei chatbot non solo non riescono ad affrontare il problema, ma lo aggravano. Grazie alla loro fluidità e al loro stile accattivante, i riassunti generati dall'IA danno facilmente un'impressione di affidabilità, mentre il contenuto effettivo risulta distorto. In un caso, DeepSeek ha modificato la frase "sicuro e implementabile con successo" in "trattamento sicuro ed efficace", un'interpretazione che si discostava dalle conclusioni originali dello studio.
In un altro esempio, il modello Llama ha applicato raccomandazioni per la somministrazione di farmaci per il diabete a soggetti giovani senza specificare dosaggio, frequenza o effetti collaterali. Se il lettore, medico o operatore sanitario , non verifica le informazioni confrontandole con lo studio originale, questo tipo di riassunti potrebbe rappresentare un pericolo diretto per i pazienti.
Gli esperti ritengono che questo fenomeno derivi dal modo in cui vengono addestrati i modelli di intelligenza artificiale. Molti chatbot attuali vengono addestrati utilizzando dati secondari, come notizie scientifiche prodotte in massa, che sono già state semplificate. Man mano che l'IA continua a riassumere questi contenuti semplificati, aumenta il rischio di distorsione.
Gli esperti di intelligenza artificiale nel campo della salute mentale sostengono che sia necessario stabilire al più presto delle barriere tecniche allo sviluppo e all'utilizzo dell'IA.
Gli utenti devono fare attenzione, poiché i chatbot possono facilmente distorcere i contenuti.
Poiché gli utenti si affidano sempre più ai chatbot basati sull'intelligenza artificiale per apprendere informazioni scientifiche, piccole imprecisioni nell'interpretazione possono accumularsi e diffondersi rapidamente, portando a una diffusa errata interpretazione. In un momento in cui la fiducia nella scienza è in calo, questo rischio è particolarmente preoccupante e richiede la dovuta attenzione.
L'integrazione dell'intelligenza artificiale nella ricerca e nella divulgazione della conoscenza è una tendenza irreversibile. Tuttavia, gli esperti affermano che la tecnologia non può sostituire il ruolo degli esseri umani nella comprensione e nella verifica dei contenuti scientifici. Quando si utilizzano i chatbot in settori ad alto rischio come quello sanitario, la priorità deve essere data all'accuratezza, piuttosto che concentrarsi esclusivamente sulla fluidità del linguaggio o sulla velocità di risposta.
Fonte: https://khoahocdoisong.vn/chatgpt-deepseek-bop-meo-du-lieu-khoa-hoc-post1552971.html








