Зображення уроку 58.png
Фото: Середина подорожі

Коли ми думаємо про те, що робить аудіокнигу незабутньою, це завжди людські моменти: зітхання, коли навертаються сльози, або слова, сказані зі щирою посмішкою.

Мельбурнська акторка та читачка аудіокниг Аннабель Тюдор каже, що саме людський інстинкт розповідати історії робить читання аудіокниг таким первісним і цінним навиком. «Наші голоси так легко відображають наші емоції», – каже вона.

Але як вид мистецтва, він може бути під загрозою. У травні Audible, компанія аудіокниг, що належить Amazon, оголосила, що дозволить авторам і видавцям вибирати з понад 100 голосів, згенерованих штучним інтелектом, для читання аудіокниг англійською, іспанською, французькою та італійською мовами. Очікується, що пізніше цього року також буде запущено переклад аудіокниг за допомогою штучного інтелекту — новина, яка викликала як критику, так і цікавість у видавничій галузі.

В Австралії, де менше компаній з виробництва аудіокниг, а актори-початківці, такі як Tudor, покладаються на роботу, щоб зводити кінці з кінцями, зростає занепокоєння щодо втрати робочих місць, прозорості та якості.

Хоча Тюдор, яка прочитала 48 книг, не переконана, що штучний інтелект може робити те, що робить вона, вона стурбована тим, що низька якість може відлякати публіку від цього формату.

Бум аудіокниг

Згідно зі звітом NielsenIQ Bookdata 2024, понад половина слухачів аудіокниг в Австралії збільшили час прослуховування за останні п'ять років. У світовому масштабі продажі аудіокниг у США зростуть на 13% з 2023 по 2024 рік; у Великій Британії доходи від аудіокниг досягнуть нового максимуму в 268 мільйонів фунтів стерлінгів, що на 31% більше, ніж у 2023 році, згідно з даними Британської асоціації видавців.

Зі зростанням попиту компанії прагнули виробляти їх швидше та дешевше. У січні 2023 року Apple запустила новий каталог аудіокниг із голосами на базі штучного інтелекту. Пізніше того ж року Amazon дозволила авторам, які самостійно видають свої книги у США та мають книги на Kindle, конвертувати свої електронні книги в аудіокниги за допомогою технології «віртуального голосу» зі штучним інтелектом, і тепер через Audible розповсюджуються десятки тисяч аудіокниг, які можна читати на комп’ютері.

У лютому Spotify також оголосив, що прийматиме аудіокниги, зчитувані за допомогою штучного інтелекту, прагнучи «знизити бар’єр входу» для авторів, які хочуть охопити більше читачів. Audible стверджує, що їхня мета схожа: доповнювати, а не замінювати людські голоси, дозволяючи більшій кількості авторів і книг охопити ширшу аудиторію. У США Audible також тестує функцію клонування голосу, яка дозволяє читачам створювати версії власних голосів для розширення виробництва високоякісних аудіокниг.

«У 2023 та 2024 роках Audible Studios найматиме більше читачів, ніж будь-коли», – сказав речник Audible газеті Guardian. «Ми продовжуємо отримувати запити від авторів, які хочуть перенести свої роботи в аудіоформат, охоплюючи нову аудиторію кількома мовами».

Але голоси роботів завжди будуть дешевшими за людські, і фахівці з озвучування та видавничої справи бояться, що тенденція до штучного інтелекту загрожуватиме їхній роботі.

Масове виробництво чи гарантія якості?

Кар'єра Дордже Своллоу у сфері аудіокниг розпочалася після того, як він озвучив романи австралійського автора бестселерів-криміналістів Кріса Хаммера, яких він прочитав близько 70. Своллоу каже, що аудіокниги зі штучним інтелектом – це інструмент для людей, які «не розуміють цінності, техніки та навичок», необхідних для створення якісної аудіокниги.

«Ми так наполегливо працювали та стількома жертвували, щоб досягти того, де ми є сьогодні, і думати, що можна просто натиснути кнопку та отримати щось еквівалентне або достатньо хороше – це смішно», – сказав він.

Саймон Кеннеді, президент Австралійської гільдії акторів озвучування, сказав, що вже давно точаться дебати щодо того, скільки слід платити читачам аудіокниг. Часто акторам потрібно вдвічі або втричі більше часу, щоб прочитати годину аудіокниги, не кажучи вже про час, який потрібен для її попереднього прочитання, щоб зрозуміти зміст і персонажів. «На мою думку, використання голосів зі штучним інтелектом надає пріоритет кількості над якістю – і це здешевлює весь процес», – сказав він.

Кеннеді заснував Австралійську асоціацію акторів озвучування у 2024 році, щоб вирішити загрозу заміни штучним інтелектом. У звіті парламентському комітету минулого року організація заявила, що 5000 робочих місць у сфері озвучування в Австралії перебувають під загрозою.

«Якщо ви просто хочете рівний, монотонний голос від початку до кінця і називаєте це «високою якістю», це нормально», – сказав він. «Але якщо ви шукаєте захопливу, захопливу історію, яка триматиме вас у напрузі, не очікуйте, що штучний інтелект вам це дасть».

Цього року Ханна Кент, відома авторка книги «Похоронні обряди та відданість», була серед кількох австралійських письменниць, шокованих тим, що її роботу було піратськи захищено для навчання системи штучного інтелекту Meta. Вона сказала, що її першою реакцією на вторгнення штучного інтелекту в творчий простір зазвичай було «обурення та протест», але її також заінтригувало оголошення Audible, особливо її плани щодо тестування перекладів штучного інтелекту іншими мовами.

«Я думаю, що всім зрозуміло, що головна причина використання штучного інтелекту — це зниження витрат, і це зробить речі дешевшими — як буквально, так і творчо, а це означає, що ми більше не шануємо дух оповіді та художнього натхнення, як раніше», — поділився Кент.

Тюдор і Своллоу вважають, що великим компаніям буде важко повністю замінити людські голоси, частково тому, що багато австралійських авторів будуть цьому проти.

Але чи справді слухачі можуть відчути різницю, залишається відкритим питанням.

(За даними газети «Ґардіан»)

Джерело: https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html