Egy brit nő, aki motoros neuronbetegségben (MND) szenvedett, ami miatt képtelen volt beszélni, újra képes volt a saját hangján kommunikálni a mesterséges intelligencia (MI) technológiának és egy régi családi videóból átvett nyolc másodperces felvételnek köszönhetően.
Sarah Ezekiel, az Észak-Londonban élő művész 25 évvel ezelőtt, második gyermekével várandós, 34 éves korában, afféle agysérülés (MNS) diagnózisa után elvesztette beszédképességét.
A betegség károsítja az idegrendszert, gyengíti a nyelv, a száj és a torok izmait, aminek következtében egyes betegek teljesen elveszítik a beszédképességüket.
Ezekiel évekig számítógépet és hanggeneráló technológiát használt a kommunikációhoz, de a hang nem úgy hangzott, mint az övé. Két gyermeke, Aviva és Eric, anélkül nőttek fel, hogy valaha is ismerték volna anyjuk valódi hangját.
Az utóbbi években a szakértők képesek voltak a technológia segítségével újraalkotni egy személy eredeti hangját. Ez a technika azonban hosszú, kiváló minőségű felvételeket igényel, és a kapott hangot gyakran „monotonnak” tekintik.
Simon Poole, a brit Smartbox orvosi médiavállalat képviselője elmondta, hogy a cég kezdetben egy 60 perces felvételt kért Ezekiel asszonytól.
Ezekiel asszony azonban csak egy nagyon rövid és rossz minőségű részletet talált, amelyet egy 1990-es évekbeli otthoni videóból vettek át. A klip mindössze 8 másodperc hosszú volt, torz hanggal és a tévéből származó zajjal telt.
Mr. Poole az ElevenLabs, egy New York-i székhelyű mesterséges intelligencia alapú hanggeneráló cég által kifejlesztett technológiához fordult, amely nagyon kevés adattal képes valósághű hangokat létrehozni.
Mr. Poole egy mesterséges intelligencia által biztosított eszközzel kinyerte a hangot a régi felvételből, majd egy másik – valós hangadatokon betanított – eszközzel alkotta meg a végeredményt.
Az eredmény mélyen meghatotta Ezekiel asszonyt. Az újraalkotott hang nagyon hasonlított az övére, jellegzetes londoni akcentussal és enyhe selypítéssel, amit korábban nem szeretett.
Az MND UK szerint a diagnózis felállítása után tízből akár nyolc embernél is beszédnehézségek jelentkeznek. A jelenlegi számítógéppel generált hangokat azonban gyakran ritmus- és érzelemmentesnek ítélik.
Mr. Poole szerint a mesterséges intelligencia technológia fejlődése napjainkban az emberi hangokhoz hasonló és érzelmes hangok létrehozásának képességét jelenti, ezáltal „életet lehelve” a korábban száraz számítógépes hangokba. Hangsúlyozta, hogy a hang személyre szabása a személyes identitás megőrzésének egyik módja is.
Azokat az embereket, akiknél fennáll a beszédképesség elvesztésének veszélye olyan állapotok miatt, mint az ALS, ma már gyakran arra ösztönzik, hogy a lehető leghamarabb rögzítsék a hangjukat személyazonosságuk megőrzése és a jövőbeni kommunikáció megkönnyítése érdekében.
Azonban mielőtt az okostelefonok elterjedtek volna, a megfelelő felvételek készítése nem volt egyszerű.
Forrás: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






Hozzászólás (0)