Une Britannique atteinte de la maladie de Charcot (SLA), qui lui a fait perdre la capacité de parler, a pu communiquer à nouveau en utilisant sa propre voix grâce à la technologie de l'intelligence artificielle (IA) et à un enregistrement audio de 8 secondes provenant d'une ancienne vidéo de famille.
Sarah Ezekiel, une artiste vivant dans le nord de Londres, a perdu la parole après avoir reçu un diagnostic de SLA à l'âge de 34 ans, alors qu'elle était enceinte de son deuxième enfant, il y a 25 ans.
La maladie endommage le système nerveux, affaiblissant les muscles de la langue, de la bouche et de la gorge, ce qui peut entraîner chez certains patients une perte totale de la parole.
Pendant de nombreuses années, Ezekiel a dû utiliser des ordinateurs et des synthétiseurs vocaux pour communiquer, mais la voix obtenue n'était pas la sienne. Ses deux enfants, Aviva et Eric, ont grandi sans jamais connaître la véritable voix de leur mère.
Ces dernières années, les experts ont réussi à utiliser la technologie pour recréer la voix originale d'une personne. Cependant, cette technique nécessite des enregistrements longs et de haute qualité, et la voix obtenue est souvent jugée « monotone ».
Simon Poole, représentant de la société britannique de médias médicaux Smartbox, a déclaré que la société avait initialement demandé à Mme Ezekiel de fournir un enregistrement de 60 minutes.
Cependant, Mme Ezekiel n'a trouvé qu'un très court extrait de mauvaise qualité, tiré d'une vidéo familiale des années 1990. L'extrait ne durait que 8 secondes, était déformé et contenait du bruit de fond provenant de la télévision.
M. Poole a dû se tourner vers une technologie développée par ElevenLabs, une entreprise new-yorkaise spécialisée dans la génération vocale par intelligence artificielle. Cette technologie est capable de reproduire une parole réaliste avec très peu de données.
M. Poole a utilisé un outil d'IA pour séparer la voix de l'ancien enregistrement, puis un autre outil — entraîné avec de vraies données vocales — pour créer le produit final.
Le résultat a profondément touché Mme Ezekiel. La voix reconstituée était très semblable à sa véritable voix, qui avait un accent londonien prononcé et un léger zézaiement qu'elle n'appréciait guère auparavant.
Selon l'association britannique MND, huit personnes sur dix atteintes de cette maladie rencontrent des difficultés d'élocution après le diagnostic. Or, les voix de synthèse actuelles sont souvent critiquées pour leur manque de rythme et d'émotion.
M. Poole a déclaré que les progrès actuels en matière d'intelligence artificielle résident dans sa capacité à créer des voix expressives et naturelles, insufflant ainsi une nouvelle vie aux voix informatiques auparavant monotones. Il a souligné que la personnalisation des voix est également un moyen de préserver l'identité de chacun.
Actuellement, les personnes risquant de perdre la parole en raison de maladies comme la SLA sont souvent encouragées à enregistrer leur voix le plus tôt possible afin de préserver leur identité et de faciliter leurs communications futures.
Cependant, avant que les smartphones ne deviennent populaires, obtenir des enregistrements corrects n'était pas facile.
Source : https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp










Comment (0)