Una mujer británica que sufría la enfermedad de la neurona motora (EMN), que le hizo perder la capacidad de hablar, ha podido volver a comunicarse utilizando su propia voz gracias a la tecnología de inteligencia artificial (IA) y a una grabación de audio de 8 segundos de un antiguo vídeo familiar.
Sarah Ezekiel, una artista que vive en el norte de Londres, perdió su capacidad de hablar después de que le diagnosticaran ELA a la edad de 34 años mientras estaba embarazada de su segundo hijo hace 25 años.
Esta enfermedad daña el sistema nervioso, debilitando los músculos de la lengua, la boca y la garganta, provocando que algunos pacientes pierdan por completo la capacidad de hablar.
Durante muchos años, Ezequiel tuvo que usar computadoras y tecnología de generación de voz para comunicarse, pero la voz resultante no sonaba como la suya. Sus dos hijos, Aviva y Eric, crecieron sin conocer la verdadera voz de su madre.
En los últimos años, los expertos han logrado usar la tecnología para recrear la voz original de una persona. Sin embargo, esta técnica requiere grabaciones largas y de alta calidad, y la voz resultante suele considerarse monótona.
Simon Poole, representante de la empresa británica de comunicaciones sanitarias Smartbox, dijo que la empresa inicialmente solicitó a Ezekiel que proporcionara una grabación de audio de 60 minutos.
Sin embargo, la Sra. Ezekiel solo encontró un clip muy corto y de baja calidad, tomado de un video familiar de la década de 1990. El clip tenía solo 8 segundos de duración, estaba distorsionado y contenía ruido de fondo del televisor.
El Sr. Poole tuvo que recurrir a la tecnología desarrollada por ElevenLabs, un generador de voz con IA con sede en Nueva York. Esta tecnología es capaz de reproducir voz realista con muy pocos datos.
El Sr. Poole utilizó una herramienta de inteligencia artificial para separar la voz de la grabación anterior y luego utilizó otra herramienta, entrenada con datos de voz reales, para crear el producto final.
El resultado conmovió profundamente a la Sra. Ezekiel. La voz reconstruida era muy similar a su voz real, que tenía un acento londinense distintivo y un ligero ceceo que antes le disgustaba.
Según la Asociación de EMN del Reino Unido, ocho de cada diez personas con esta afección experimentan dificultades para hablar tras el diagnóstico. Sin embargo, las voces generadas por computadora actuales suelen ser criticadas por su falta de ritmo y emoción.
El Sr. Poole afirmó que el avance actual en la tecnología de IA reside en su capacidad para crear voces humanas y expresivas, revitalizando así las voces informáticas, que antes eran monótonas. Enfatizó que personalizar las voces también es una forma de preservar la identidad individual.
En la actualidad, a las personas que corren el riesgo de perder su capacidad de hablar debido a afecciones como la ELA se les suele animar a grabar sus voces lo antes posible para preservar su identidad personal y para futuros fines de comunicación.
Sin embargo, antes de que los teléfonos inteligentes se generalizaran, obtener grabaciones de audio adecuadas no era fácil.
Fuente: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






Kommentar (0)