OpenAI's spraak-naar-tekst AI-tool betrapt op het verzinnen van verhalen

Techgigant OpenAI prees zijn spraak-naar-teksttool Whisper aan als een AI met 'menselijke nauwkeurigheid en robuustheid'. Maar Whisper had één groot nadeel: de tool genereerde tekst en zinnen die volkomen onjuist waren.

Công cụ AI trong bệnh viện bịa ra những điều không ai nói - Ảnh 1. — Een deel van de door AI gegenereerde tekst – ‘hallucinaties’ genoemd – kan racistische opmerkingen, gewelddadige taal en zelfs denkbeeldige medische behandelingen bevatten – Foto: AP

Volgens experts is een deel van de door AI gegenereerde tekst zogenaamd 'hallucinerend', aldus AP. De tekst bevat racistische opmerkingen, gewelddadige taal en zelfs denkbeeldige medische behandelingen.

Hoog percentage 'illusie' in door AI gegenereerde teksten

Deskundigen maken zich zorgen omdat Whisper in veel sectoren wereldwijd op grote schaal wordt gebruikt om interviews te vertalen en te transcriberen, tekst te genereren in populaire consumententechnologieën en ondertiteling voor video's te maken.

Zorgelijker is dat veel medische centra Whisper gebruiken om consulten tussen artsen en patiënten over te dragen, hoewel OpenAI heeft gewaarschuwd dat de tool niet in 'hoogrisicogebieden' mag worden gebruikt.

De volledige omvang van het probleem is moeilijk vast te stellen, maar onderzoekers en ingenieurs zeggen dat ze tijdens hun werk regelmatig Whisper-"hallucinaties" tegenkomen.

Een onderzoeker aan de Universiteit van Michigan zei dat hij "hallucinaties" vond in acht van de tien audiotranscripties die hij onderzocht. Een computertechnicus vond "hallucinaties" in ongeveer de helft van de transcripties van meer dan 100 uur audio die hij analyseerde. Een andere ontwikkelaar zei dat hij "hallucinaties" vond in bijna alle 26.000 opnames die hij met Whisper maakte.

Het probleem blijft bestaan, zelfs bij korte, duidelijk opgenomen audiofragmenten. Een recente studie door computerwetenschappers vond 187 "illusies" in meer dan 13.000 heldere audiofragmenten die ze bestudeerden. Deze tendens zou leiden tot tienduizenden foutieve transcripties in miljoenen opnames, aldus de onderzoekers.

Volgens Alondra Nelson, die tot vorig jaar hoofd was van het Bureau voor Wetenschap en Technologie van het Witte Huis tijdens de regering-Biden, kunnen dergelijke fouten ‘zeer ernstige gevolgen’ hebben, vooral in ziekenhuizen.

"Niemand wil een verkeerde diagnose", zegt Nelson, nu hoogleraar aan het Institute for Advanced Study in Princeton, New Jersey. "Er moet een hogere standaard komen."

Whisper wordt ook gebruikt om ondertitels te maken voor doven en slechthorenden – een groep mensen die een bijzonder groot risico loopt op vertaalfouten. Dit komt doordat doven en slechthorenden geen manier hebben om verzonnen passages te herkennen die "verborgen zijn in alle andere tekst", aldus Christian Vogler, doof en directeur van het Technology Accessibility Program aan de Gallaudet University.

OpenAI wordt opgeroepen om het probleem op te lossen

De prevalentie van dergelijke "hallucinaties" heeft experts, voorstanders en voormalige OpenAI-medewerkers ertoe aangezet de federale overheid op te roepen AI-regelgeving te overwegen. OpenAI moet deze tekortkoming op zijn minst aanpakken.

"Dit probleem is oplosbaar als het bedrijf bereid is er prioriteit aan te geven", aldus William Saunders, een onderzoeksingenieur in San Francisco die OpenAI in februari verliet vanwege zorgen over de richting die het bedrijf op wilde gaan.

"Het zou een probleem zijn als je het op de markt brengt en mensen zo zeker worden van wat het kan dat ze het in al die andere systemen integreren." Een woordvoerder van OpenAI zei dat het bedrijf constant werkt aan manieren om de "illusies" te verzachten en de bevindingen van de onderzoekers waardeert. Hij voegde eraan toe dat OpenAI feedback verwerkt in modelupdates.

Terwijl de meeste ontwikkelaars ervan uitgaan dat tekst-naar-spraakhulpmiddelen typefouten of andere fouten kunnen maken, zeggen technici en onderzoekers dat ze nog nooit een door AI aangestuurde tekst-naar-spraakhulpmiddel hebben gezien dat zoveel "hallucineert" als Whisper.

Công cụ AI trong bệnh viện bịa ra những điều không ai nói - Ảnh 2.

Nobelprijs voor de natuurkunde 2024: de mensen die de basis legden voor AI

De Nobelprijs voor Natuurkunde van dit jaar werd toegekend aan twee wetenschappers, John J. Hopfield en Geoffrey E. Hinton, voor "hun fundamentele ontdekkingen en uitvindingen die leidden tot de ontwikkeling van machinaal leren met kunstmatige neurale netwerken."

Techgigant OpenAI prees zijn spraak-naar-teksttool Whisper aan als een AI met 'menselijke nauwkeurigheid en robuustheid'. Maar Whisper had één groot nadeel: de tool genereerde tekst en zinnen die volkomen onjuist waren.

Hoog percentage 'illusie' in door AI gegenereerde teksten

OpenAI wordt opgeroepen om het probleem op te lossen

Reactie (0)