Een Britse vrouw met motorneuronziekte (MND), waardoor ze niet kan praten, kan dankzij kunstmatige intelligentie (AI) en een opname van acht seconden uit een oude familiefilm weer communiceren met haar eigen stem.
Sarah Ezekiel, een kunstenares die in Noord-Londen woont, verloor haar spraakvermogen nadat bij haar op 34-jarige leeftijd ALS werd vastgesteld. Ze was toen zwanger van haar tweede kind, 25 jaar geleden.
De ziekte tast het zenuwstelsel aan, waardoor de spieren in de tong, de mond en de keel verzwakken. Bij sommige patiënten leidt dit ertoe dat ze helemaal niet meer kunnen spreken.
Jarenlang gebruikte Ezekiel een computer en stemtechnologie om te communiceren, maar haar stem klonk niet als die van haar. Haar twee kinderen, Aviva en Eric, groeiden op zonder ooit de echte stem van hun moeder te kennen.
De laatste jaren zijn experts erin geslaagd technologie te gebruiken om de oorspronkelijke stem van een persoon te reconstrueren. Deze techniek vereist echter lange, hoogwaardige opnames, en de resulterende stem wordt vaak als "monotoon" beschouwd.
Simon Poole, een vertegenwoordiger van het Britse medische mediabedrijf Smartbox, zei dat het bedrijf mevrouw Ezekiel aanvankelijk had gevraagd om een opname van 60 minuten te maken.
Mevrouw Ezekiel kon echter alleen een heel kort fragment van slechte kwaliteit vinden, afkomstig uit een homevideo uit de jaren negentig. Het fragment duurde slechts 8 seconden, had vervormd geluid en ruis van de tv.
De heer Poole maakte gebruik van technologie die is ontwikkeld door ElevenLabs, een in New York gevestigd bedrijf dat zich bezighoudt met AI-spraakgeneratie. Hiermee kunnen realistische stemmen worden gecreëerd met zeer weinig data.
De heer Poole gebruikte een AI-tool om de stem uit de oude opname te halen en gebruikte vervolgens een andere tool – getraind met echte stemgegevens – om het eindproduct te creëren.
De resultaten ontroerden mevrouw Ezekiel diep. De nagebootste stem leek sterk op die van haarzelf, met het kenmerkende Londense accent en de lichte lispel die ze eerder niet prettig vond.
Volgens MND UK ervaart tot acht op de tien mensen met de aandoening spraakproblemen na de diagnose. De huidige computergestuurde stemmen worden echter vaak beoordeeld als ritmisch en emotieloos.
De heer Poole zei dat de vooruitgang van AI-technologie vandaag de dag te danken is aan het vermogen om menselijke en emotionele stemmen te creëren, waardoor voorheen saaie computerstemmen "leven ingeblazen" worden. Hij benadrukte dat het personaliseren van de stem ook een manier is om de persoonlijke identiteit te behouden.
Mensen die het risico lopen hun spraakvermogen te verliezen als gevolg van aandoeningen zoals ALS, worden nu vaak aangemoedigd om zo snel mogelijk hun stem op te nemen. Zo kunnen ze hun identiteit beschermen en kunnen ze in de toekomst gemakkelijker communiceren.
Voordat smartphones populair werden, was het echter niet eenvoudig om goede opnames te maken.
Bron: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






Reactie (0)