Uma mulher britânica com doença do neurônio motor (DNM), que a deixou incapaz de falar, conseguiu se comunicar novamente usando sua própria voz graças à tecnologia de inteligência artificial (IA) e a uma gravação de oito segundos tirada de um antigo vídeo de família.
Sarah Ezekiel, uma artista que mora no norte de Londres, perdeu a capacidade de falar após ser diagnosticada com DNM aos 34 anos, enquanto estava grávida de seu segundo filho, 25 anos atrás.
A doença danifica o sistema nervoso, enfraquecendo os músculos da língua, boca e garganta, fazendo com que alguns pacientes percam completamente a capacidade de falar.
Durante anos, Ezekiel usou um computador e tecnologia de geração de voz para se comunicar, mas a voz não soava como a dela. Seus dois filhos, Aviva e Eric, cresceram sem nunca conhecer a voz real da mãe.
Nos últimos anos, especialistas conseguiram usar a tecnologia para recriar a voz original de uma pessoa. No entanto, essa técnica requer gravações longas e de alta qualidade, e a voz resultante costuma ser considerada "monótona".
Simon Poole, representante da empresa britânica de comunicações médicas Smartbox, disse que a empresa inicialmente pediu à Sra. Ezekiel que fornecesse uma gravação de 60 minutos.
No entanto, a Sra. Ezekiel só conseguiu encontrar um clipe muito curto e de baixa qualidade, tirado de um vídeo caseiro da década de 1990. O clipe tinha apenas 8 segundos de duração, som distorcido e ruído da televisão.
O Sr. Poole recorreu à tecnologia desenvolvida pela ElevenLabs, uma empresa de geração de voz por IA sediada em Nova York que consegue recriar vozes realistas com muito poucos dados.
O Sr. Poole usou uma ferramenta de IA para extrair a voz da gravação antiga e, em seguida, usou outra ferramenta — treinada com dados de voz reais — para criar o produto final.
Os resultados deixaram Ezekiel profundamente comovida. A voz reconstruída era muito semelhante à sua voz real, com o sotaque londrino característico e o leve ceceio que ela antes detestava.
De acordo com a Associação MND do Reino Unido, até oito em cada dez pessoas com a doença apresentam dificuldades de fala após o diagnóstico. No entanto, as vozes atuais geradas por computador são frequentemente criticadas por falta de ritmo e emoção.
O Sr. Poole afirmou que o avanço da tecnologia de IA hoje reside na capacidade de criar vozes humanas e emocionais, "dando vida" a vozes de computador que antes eram áridas. Ele enfatizou que personalizar a voz também é uma forma de preservar a identidade pessoal.
Pessoas em risco de perder a capacidade de falar devido a condições como a DNM agora são frequentemente incentivadas a gravar suas vozes o mais rápido possível para preservar sua identidade e facilitar a comunicação futura.
No entanto, antes dos smartphones se tornarem populares, não era fácil obter gravações adequadas.
Fonte: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp
Comentário (0)