En brittisk kvinna med motorneuronsjukdom (MND), som gjorde henne oförmögen att tala, har kunnat kommunicera igen med sin egen röst tack vare artificiell intelligens (AI) och en åtta sekunder lång inspelning tagen från en gammal familjevideo .
Sarah Ezekiel, en konstnär bosatt i norra London, förlorade sin talförmåga efter att ha fått diagnosen ALS vid 34 års ålder medan hon var gravid med sitt andra barn för 25 år sedan.
Sjukdomen skadar nervsystemet, försvagar musklerna i tungan, munnen och halsen, vilket gör att vissa patienter helt förlorar förmågan att tala.
I åratal använde Ezekiel en dator och röstgenererande teknik för att kommunicera, men rösten lät inte som hennes. Hennes två barn, Aviva och Eric, växte upp utan att någonsin känna sin mors riktiga röst.
På senare år har experter kunnat använda teknik för att återskapa en persons ursprungliga röst. Denna teknik kräver dock långa inspelningar av hög kvalitet, och den resulterande rösten anses ofta vara "monoton".
Simon Poole, en representant för det brittiska medicinska medieföretaget Smartbox, sa att företaget initialt bad Ezekiel att tillhandahålla en 60-minutersinspelning.
Fru Ezekiel kunde dock bara hitta ett mycket kort och dåligt klipp, taget från en hemmavideo från 1990-talet. Klippet var bara 8 sekunder långt, hade förvrängt ljud och brus från TV:n.
Herr Poole vände sig till teknik som utvecklats av ElevenLabs, ett New York-baserat företag inom AI-röstgenerering, som kan återskapa realistiska röster med väldigt lite data.
Herr Poole använde ett AI-verktyg för att extrahera rösten från den gamla inspelningen och använde sedan ett annat verktyg – tränat på verklig röstdata – för att skapa slutprodukten.
Resultaten rörde Mrs. Ezekiel djupt. Den återskapade rösten liknade hennes egen, med sin distinkta Londonaccent och lätta läspa som hon tidigare ogillat.
Enligt MND UK upplever upp till åtta av tio personer med tillståndet talsvårigheter efter diagnos. Dagens datorgenererade röster bedöms dock ofta sakna rytm och känsla.
Poole sa att dagens framsteg inom AI-teknik är förmågan att skapa människoliknande och känslomässiga röster, och därigenom "blåsa liv" i tidigare torra datorröster. Han betonade att personalisering av rösten också är ett sätt att bevara personlig identitet.
Personer som riskerar att förlora sin talförmåga på grund av tillstånd som ALS uppmuntras numera ofta att spela in sina röster så snart som möjligt för att bevara sin identitet och underlätta framtida kommunikation.
Men innan smartphones blev populära var det inte lätt att få till ordentliga inspelningar.
Källa: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






Kommentar (0)