Britská žena s onemocněním motorických neuronů (MND), které jí znemožnilo mluvit, byla díky technologii umělé inteligence (AI) a osmisekundové nahrávce ze starého rodinného videa opět schopna komunikovat vlastním hlasem.
Sarah Ezekiel, umělkyně žijící v severním Londýně, ztratila schopnost mluvit poté, co jí byla před 25 lety ve 34 letech během těhotenství se svým druhým dítětem diagnostikována porucha hybnosti.
Toto onemocnění poškozuje nervový systém, oslabuje svaly jazyka, úst a krku, což u některých pacientů způsobuje úplnou ztrátu schopnosti mluvit.
Ezekiel léta používal ke komunikaci počítač a technologii generování hlasu, ale hlas nezněl jako ten její. Její dvě děti, Aviva a Eric, vyrůstaly, aniž by kdy znaly skutečný hlas své matky.
V posledních letech byli odborníci schopni pomocí technologií znovu napodobit původní hlas osoby. Tato technika však vyžaduje dlouhé, vysoce kvalitní nahrávky a výsledný hlas je často považován za „monotónní“.
Simon Poole, zástupce britské společnosti Smartbox, která se zabývá lékařskými médii, uvedl, že společnost paní Ezekiel původně požádala o poskytnutí 60minutové nahrávky.
Paní Ezekiel však našla pouze velmi krátký a nekvalitní klip, převzatý z domácího videa z 90. let. Klip byl dlouhý pouhých 8 sekund, měl zkreslený zvuk a šum z televize.
Pan Poole se obrátil na technologii vyvinutou společností ElevenLabs, newyorskou společností zabývající se generováním hlasu s využitím umělé inteligence, která dokáže s velmi malým množstvím dat znovu vytvořit realistické hlasy.
Pan Poole použil nástroj umělé inteligence k extrakci hlasu ze staré nahrávky a poté k vytvoření finálního produktu použil další nástroj – vycvičený na skutečných hlasových datech.
Výsledky paní Ezekiel hluboce dojaly. Znovuvytvořený hlas se jí velmi podobal, s charakteristickým londýnským přízvukem a mírným šišláním, které dříve neměla ráda.
Podle MND UK má až osm z deseti lidí s tímto onemocněním po diagnóze potíže s řečí. Současné počítačem generované hlasy jsou však často posuzovány jako postrádající rytmus a emoce.
Pan Poole uvedl, že pokrok v technologii umělé inteligence dnes spočívá ve schopnosti vytvářet lidské a emocionální hlasy, a tím „vdechnout život“ dříve suchým počítačovým hlasům. Zdůraznil, že personalizace hlasu je také způsobem, jak si zachovat osobní identitu.
Lidé, kterým hrozí ztráta schopnosti mluvit v důsledku onemocnění, jako je MND, jsou nyní často povzbuzováni, aby si co nejdříve nahráli hlas, aby si zachovali identitu a usnadnili budoucí komunikaci.
Než se však chytré telefony staly populárními, nebylo snadné pořídit si pořádné nahrávky.
Zdroj: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






Komentář (0)