
Quand on réfléchit à ce qui rend un livre audio mémorable, ce sont toujours les moments humains : le souffle coupé quand les larmes montent aux yeux, ou les mots prononcés avec un sourire sincère.
L’actrice et lectrice de livres audio Annabelle Tudor, basée à Melbourne, affirme que c’est notre instinct humain de raconter des histoires qui fait de la lecture de livres audio une compétence si primitive et précieuse. « Nos voix reflètent si facilement nos émotions », dit-elle.
Mais en tant que forme d'art, elle pourrait être menacée. En mai, Audible, la société de livres audio appartenant à Amazon, a annoncé qu'elle permettrait aux auteurs et aux éditeurs de choisir parmi plus de 100 voix générées par intelligence artificielle pour lire des livres audio en anglais, espagnol, français et italien. La traduction automatique des livres audio par l'IA devrait également être lancée plus tard cette année – une nouvelle qui a suscité à la fois critiques et curiosité dans le secteur de l'édition.
En Australie, où les sociétés de production de livres audio sont moins nombreuses et où les acteurs en herbe comme Tudor dépendent de ce travail pour joindre les deux bouts, les inquiétudes concernant les pertes d'emplois, la transparence et la qualité s'accroissent.
Bien que Tudor, qui a lu 48 livres, ne soit pas convaincue que l'IA puisse faire ce qu'elle fait, elle craint qu'une mauvaise qualité ne détourne le public de ce format.
L'essor des livres audio
D’après le rapport Bookdata 2024 de NielsenIQ, plus de la moitié des auditeurs de livres audio en Australie ont augmenté leur temps d’écoute ces cinq dernières années. À l’échelle mondiale, les ventes de livres audio aux États-Unis devraient progresser de 13 % entre 2023 et 2024 ; au Royaume-Uni, les recettes issues du secteur atteindront un nouveau record de 268 millions de livres sterling, soit une hausse de 31 % par rapport à 2023, selon la British Publishers Association.
Face à la forte demande, les entreprises ont cherché à produire ces livres audio plus rapidement et à moindre coût. En janvier 2023, Apple a lancé un nouveau catalogue de livres audio avec des voix de synthèse. Plus tard dans l'année, Amazon a permis aux auteurs autoédités américains possédant une liseuse Kindle de convertir leurs ebooks en livres audio grâce à la technologie de « voix virtuelle » basée sur l'IA. Des dizaines de milliers de livres audio lisibles sur ordinateur sont désormais distribués via Audible.
En février, Spotify a également annoncé qu'il accepterait les livres audio lus par une IA, dans le but de faciliter l'accès au marché pour les auteurs souhaitant toucher un public plus large. Audible affirme poursuivre un objectif similaire : compléter, et non remplacer, les voix humaines, permettant ainsi à un plus grand nombre d'auteurs et de titres d'atteindre un public plus vaste. Aux États-Unis, Audible teste également une fonctionnalité de clonage vocal qui permet aux lecteurs de créer des versions de leur propre voix afin de développer la production de livres audio de haute qualité.
« En 2023 et 2024, Audible Studios recrutera plus de lecteurs que jamais », a déclaré un porte-parole d'Audible au Guardian. « Nous continuons de recevoir des demandes d'auteurs souhaitant adapter leurs œuvres en format audio et toucher ainsi de nouveaux publics dans plusieurs langues. »
Mais les voix de robots seront toujours moins chères que les voix humaines – et les professionnels du doublage et de l'édition craignent que la tendance à l'IA ne menace leurs emplois.
Production de masse ou assurance qualité ?
La carrière de Dorje Swallow dans le domaine des livres audio a décollé après qu'il a prêté sa voix aux romans de Chris Hammer, auteur australien de romans policiers à succès, dont il a lu environ 70 titres. Swallow affirme que les livres audio générés par l'IA sont un outil destiné aux personnes qui « ne comprennent pas la valeur, la technique et le savoir-faire » nécessaires à la création d'un livre audio de qualité.
« Nous avons travaillé si dur et fait tant de sacrifices pour en arriver là où nous sommes aujourd'hui, et penser qu'il suffit d'appuyer sur un bouton pour obtenir quelque chose d'équivalent, ou d'assez bien, c'est ridicule », a-t-il déclaré.
Simon Kennedy, président de la Guilde australienne des acteurs vocaux, a déclaré que le débat sur la rémunération des lecteurs de livres audio était ancien. Il faut souvent deux à trois fois plus de temps aux acteurs pour enregistrer une heure de livre audio, sans compter le temps de lecture préalable nécessaire pour comprendre le contenu et les personnages. « À mon avis, l'utilisation de voix de synthèse privilégie la quantité à la qualité et dévalorise l'ensemble du processus », a-t-il affirmé.
Kennedy a fondé l'Association australienne des acteurs de doublage en 2024 pour contrer la menace que représente le remplacement des comédiens de doublage par l'intelligence artificielle. Dans un rapport présenté l'an dernier à une commission parlementaire , l'association a indiqué que 5 000 emplois de comédiens de doublage en Australie étaient menacés.
« Si vous vous contentez d'une voix plate et monotone du début à la fin et que vous considérez cela comme de la "haute qualité", très bien », a-t-il déclaré. « Mais si vous recherchez une histoire captivante et palpitante qui vous tient en haleine, n'attendez pas cela de l'IA. »
Cette année, Hannah Kent, l'auteure reconnue de « Burial Rites » et « Devotion », figurait parmi les nombreux écrivains australiens choqués de découvrir que son œuvre avait été piratée pour entraîner le système d'intelligence artificielle de Meta. Elle a déclaré que sa première réaction face à l'intrusion de l'IA dans le domaine de la création était généralement « l'indignation et la protestation », mais qu'elle était également intriguée par l'annonce d'Audible, notamment par son projet de tester les traductions automatiques dans d'autres langues.
« Je pense qu’il est clair pour tout le monde que la principale raison d’utiliser l’IA est de réduire les coûts, ce qui rendra les choses moins chères – au sens propre comme au figuré – et signifie que nous n’honorons plus l’esprit de la narration et de l’inspiration artistique comme auparavant », a déclaré Kent.
Tudor et Swallow estiment qu'il sera difficile pour les grandes entreprises de remplacer complètement les voix humaines, notamment parce que de nombreux auteurs australiens s'y opposeraient.
Mais la question de savoir si les auditeurs peuvent réellement percevoir la différence reste ouverte.
(Selon The Guardian)
Source : https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html










Comment (0)