Obraz lekcji 58.png
Zdjęcie: Midjourney

Kiedy myślimy o tym, co sprawia, że ​​audiobook jest niezapomniany, zawsze przychodzą nam na myśl chwile z udziałem człowieka: westchnienie, gdy napływają do oczu łzy, lub słowa wypowiedziane ze szczerym uśmiechem.

Mieszkająca w Melbourne aktorka i czytelniczka audiobooków Annabelle Tudor twierdzi, że to nasz ludzki instynkt opowiadania historii sprawia, że ​​czytanie audiobooków jest tak pierwotną i cenną umiejętnością. „Nasze głosy tak łatwo odzwierciedlają nasze emocje” – mówi.

Jednak jako forma sztuki może być zagrożona. W maju Audible, firma produkująca audiobooki należąca do Amazona, ogłosiła, że ​​umożliwi autorom i wydawcom wybór spośród ponad 100 głosów generowanych przez sztuczną inteligencję do czytania audiobooków w języku angielskim, hiszpańskim, francuskim i włoskim. Oczekuje się również, że jeszcze w tym roku uruchomiona zostanie usługa tłumaczenia audiobooków przez sztuczną inteligencję – wiadomość ta wywołała zarówno krytykę, jak i zainteresowanie w branży wydawniczej.

W Australii, gdzie jest mniej firm produkujących audiobooki, a początkujący aktorzy, tacy jak Tudor, polegają na tej pracy, aby związać koniec z końcem, rosną obawy dotyczące utraty miejsc pracy, przejrzystości i jakości.

Choć Tudor, która przeczytała 48 książek, nie jest przekonana, że ​​sztuczna inteligencja może zrobić to, co ona, obawia się, że słaba jakość może zniechęcić czytelników do tego formatu.

Boom na audiobooki

Według raportu NielsenIQ Bookdata 2024, ponad połowa słuchaczy audiobooków w Australii zwiększyła swój czas słuchania w ciągu ostatnich pięciu lat. Globalnie sprzedaż audiobooków w Stanach Zjednoczonych ma wzrosnąć o 13% w latach 2023-2024; w Wielkiej Brytanii przychody z audiobooków osiągną nowy rekord 268 milionów funtów, co stanowi wzrost o 31% w porównaniu z rokiem 2023, według British Publishers Association.

Wraz ze wzrostem popytu, firmy dążyły do ​​szybszej i tańszej produkcji. W styczniu 2023 roku Apple uruchomiło nowy katalog audiobooków z głosami AI. Jeszcze w tym samym roku Amazon umożliwił autorom publikującym samodzielnie w Stanach Zjednoczonych, którzy mają książki na Kindle, konwersję e-booków na audiobooki za pomocą technologii „wirtualnego głosu” AI – a dziesiątki tysięcy audiobooków w formacie komputerowym jest obecnie dystrybuowanych za pośrednictwem Audible.

W lutym Spotify ogłosiło również, że będzie akceptować audiobooki czytane przez sztuczną inteligencję, dążąc do „obniżenia bariery wejścia” dla autorów, którzy chcą dotrzeć do większej liczby czytelników. Audible twierdzi, że jego cel jest podobny: uzupełniać, a nie zastępować, głosy ludzkie, umożliwiając większej liczbie autorów i tytułów dotarcie do szerszego grona odbiorców. W Stanach Zjednoczonych Audible testuje również funkcję klonowania głosu, która pozwala czytelnikom tworzyć wersje swoich własnych głosów, aby zwiększyć produkcję wysokiej jakości audiobooków.

„W latach 2023 i 2024 Audible Studios będzie zatrudniać więcej czytelników niż kiedykolwiek wcześniej” – powiedział rzecznik Audible w rozmowie z Guardianem. „Wciąż otrzymujemy prośby od autorów, którzy chcą przenieść swoje dzieła do wersji audio, docierając do nowej publiczności w wielu językach”.

Jednak głosy robotów zawsze będą tańsze od głosów ludzkich, a profesjonaliści zajmujący się nagrywaniem głosów i publikowaniem obawiają się, że trend sztucznej inteligencji zagrozi ich pracy.

Produkcja masowa czy zapewnienie jakości?

Kariera Dorje Swallow jako autora audiobooków nabrała rozpędu po tym, jak zaczął użyczać głosu powieściom australijskiego autora kryminałów Chrisa Hammera, których przeczytał około 70. Swallow twierdzi, że audiobooki oparte na sztucznej inteligencji to narzędzie dla osób, które „nie rozumieją wartości, techniki i umiejętności” niezbędnych do stworzenia wysokiej jakości audiobooka.

„Tak ciężko pracowaliśmy i tak wiele poświęciliśmy, żeby dojść do miejsca, w którym jesteśmy dzisiaj, a myślenie, że można po prostu nacisnąć przycisk i dostać coś równoważnego, albo wystarczająco dobrego, jest śmieszne” – powiedział.

Simon Kennedy, prezes Australijskiej Gildii Aktorów Głosowych (Australian Voice Actors Guild), powiedział, że od dawna toczy się debata na temat tego, ile powinni zarabiać lektorzy audiobooków. Aktorzy często potrzebują dwa lub trzy razy więcej czasu, aby wysłuchać godzinnego audiobooka, nie wspominając o czasie potrzebnym na jego wcześniejsze przeczytanie, aby zrozumieć treść i postacie. „Moim zdaniem korzystanie z głosów AI to priorytet nad jakością – i obniża wartość całego procesu” – powiedział.

Kennedy założył Australijskie Stowarzyszenie Aktorów Głosowych w 2024 roku, aby stawić czoła zagrożeniu zastąpienia sztucznej inteligencji (AI). W raporcie dla komisji parlamentarnej z zeszłego roku organizacja stwierdziła, że ​​5000 miejsc pracy dla aktorów głosowych w Australii jest zagrożonych.

„Jeśli chcesz po prostu płaskiego, monotonnego głosu od początku do końca i nazywasz to 'wysoką jakością', to w porządku” – powiedział. „Ale jeśli szukasz wciągającej, angażującej historii, która trzyma w napięciu – nie oczekuj, że sztuczna inteligencja ci to zapewni”.

W tym roku Hannah Kent, uznana autorka książek „Burial Rites and Devotion”, znalazła się wśród kilku australijskich pisarzy zszokowanych odkryciem, że jej prace zostały skopiowane w celu wyszkolenia systemu sztucznej inteligencji Meta. Powiedziała, że ​​jej pierwszą reakcją na ingerencję sztucznej inteligencji w przestrzeń twórczą było zazwyczaj „oburzenie i protest”, ale była również zaintrygowana ogłoszeniem Audible – zwłaszcza planami testowania tłumaczeń AI na inne języki.

„Myślę, że dla wszystkich jest jasne, że głównym powodem korzystania ze sztucznej inteligencji jest redukcja kosztów, a to sprawi, że wszystko stanie się tańsze – zarówno dosłownie, jak i kreatywnie. Oznacza to, że nie będziemy już tak jak wcześniej czcić ducha opowiadania historii i artystycznej inspiracji” – powiedział Kent.

Tudor i Swallow uważają, że dla dużych firm trudne będzie całkowite zastąpienie ludzkiego głosu, częściowo dlatego, że wielu australijskich autorów sprzeciwiałoby się takiemu rozwiązaniu.

Otwartym pozostaje jednak pytanie, czy słuchacze faktycznie zauważą różnicę.

(Według The Guardian)

Źródło: https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html