58. lecke képe.png
Fotó: Útközben

Amikor arra gondolunk, hogy mitől lesz emlékezetes egy hangoskönyv, mindig az emberi pillanatok számítanak: a zihálás, amikor könnyek szöknek a szemünkbe, vagy az őszinte mosollyal kimondott szavak.

A Melbourne-ben élő színész és hangoskönyv-olvasó, Annabelle Tudor szerint az emberi történetmesélési ösztönünk teszi a hangoskönyv-olvasást ilyen ősi és értékes készséggé. „A hangunk olyan könnyen tükrözi az érzelmeinket” – mondja.

De mint művészeti forma veszélyben lehet. Májusban az Amazon tulajdonában lévő Audible hangoskönyv-gyártó cég bejelentette, hogy lehetővé teszi a szerzők és kiadók számára, hogy több mint 100 mesterséges intelligencia által generált hang közül válasszanak, és angol, spanyol, francia és olasz nyelvű hangoskönyveket olvassanak fel. A mesterséges intelligencia által generált hangoskönyv-fordítás várhatóan még idén elindul – ez a hír kritikát és kíváncsiságot váltott ki a kiadói iparágban.

Ausztráliában – ahol kevesebb a hangoskönyv-gyártó cég, és a feltörekvő színészek, mint például Tudor, a munkára támaszkodnak a megélhetésük érdekében – egyre nőnek az aggodalmak a munkahelyek elvesztése, az átláthatóság és a minőség miatt.

Bár a 48 könyvet elolvasó Tudor nincs meggyőződve arról, hogy a mesterséges intelligencia képes arra, amit ő, attól tart, hogy a gyenge minőség elriaszthatja a közönséget a formátumtól.

Hangoskönyv-boom

A NielsenIQ Bookdata 2024 jelentése szerint Ausztráliában a hangoskönyv-hallgatók több mint fele növelte a hangoskönyvek hallgatására fordított idejét az elmúlt öt évben. Globális szinten az Egyesült Államokban a hangoskönyv-eladások várhatóan 13%-kal fognak növekedni 2023 és 2024 között; az Egyesült Királyságban a hangoskönyvekből származó bevételek új csúcsot fognak elérni, 268 millió fontot, ami 31%-os növekedést jelent 2023-hoz képest a Brit Kiadók Szövetsége szerint.

Ahogy a kereslet megnőtt, a vállalatok gyorsabb és olcsóbb előállítási lehetőségekre törekedtek. 2023 januárjában az Apple elindított egy új hangoskönyv-katalógust mesterséges intelligencia által vezérelt hangokkal. Később, ugyanebben az évben az Amazon lehetővé tette az Egyesült Államokban Kindle-könyvekkel rendelkező, saját kiadású szerzők számára, hogy e-könyveiket mesterséges intelligencia által vezérelt „virtuális hang” technológia segítségével hangoskönyvekké alakítsák – és ma már több tízezer számítógéppel olvasható hangoskönyvet terjesztenek az Audible-on keresztül.

Februárban a Spotify is bejelentette, hogy mesterséges intelligencia által felolvasott hangoskönyveket is fogad, azzal a céllal, hogy „csökkentse a belépési korlátokat” azoknak a szerzőknek, akik több olvasót szeretnének elérni. Az Audible szerint a célja hasonló: kiegészíteni, nem pedig helyettesíteni az emberi hangokat, lehetővé téve több szerző és cím számára, hogy szélesebb közönséghez jusson el. Az Egyesült Államokban az Audible egy hangklónozási funkciót is tesztel, amely lehetővé teszi az olvasók számára, hogy saját hangjuk verzióit hozzák létre, ezáltal bővítve a kiváló minőségű hangoskönyvek gyártását.

„2023-ban és 2024-ben az Audible Studios minden eddiginél több olvasót fog felvenni” – mondta az Audible szóvivője a Guardiannek. „Továbbra is kapunk megkereséseket olyan szerzőktől, akik hangoskönyv formájában szeretnék műveiket megszólaltatni, több nyelven új közönséget elérve.”

De a robothangok mindig olcsóbbak lesznek, mint az emberi hangok – és a hangalámondás, valamint a kiadói szakemberek attól tartanak, hogy a mesterséges intelligencia trendje veszélyezteti az állásukat.

Tömeggyártás vagy minőségbiztosítás?

Dorje Swallow hangoskönyv karrierje akkor indult be, amikor Chris Hammer ausztrál bestseller krimiíró regényeit hangoztatta, amelyekből körülbelül 70-et olvasott el. Swallow szerint a mesterséges intelligencia által támogatott hangoskönyvek olyan emberek számára jelentenek eszközt, akik „nem értik a minőségi hangoskönyvek készítéséhez szükséges értéket, technikát és készséget”.

„Annyi keményen dolgoztunk és annyit áldoztunk fel, hogy eljussunk oda, ahol ma tartunk, és azt gondolni, hogy csak meg kell nyomni egy gombot, és valami azzal egyenértékűt vagy elég jót kapunk – ez nevetséges” – mondta.

Simon Kennedy, az Ausztrál Hangszínészek Céhének elnöke szerint régóta vita folyik arról, hogy mennyit kellene fizetni a hangoskönyv-olvasóknak. A színészeknek gyakran kétszer-háromszor annyi időbe telik egy óra hangoskönyv elolvasása, nem is beszélve arról, hogy mennyi időbe telik előzetesen elolvasni a tartalmat és a karaktereket. „Véleményem szerint a mesterséges intelligencia által működtetett hangok használata a mennyiséget helyezi előtérbe a minőséggel szemben – és ez olcsósítja az egész folyamatot” – mondta.

Kennedy 2024-ben alapította az Ausztrál Szinkronszínészek Szövetségét (Australian Voice Actors Association), hogy kezelje a mesterséges intelligencia általi helyettesítés veszélyét. Egy tavalyi parlamenti bizottságnak benyújtott jelentésében a szervezet kijelentette, hogy 5000 szinkronszínészi állás van veszélyben Ausztráliában.

„Ha csak egy monoton, lapos hangzásra vágysz az elejétől a végéig, és azt „kiváló minőségnek” nevezed, az rendben van” – mondta. „De ha egy lebilincselő, lebilincselő történetet keresel, ami állandóan a széked szélén tart – ne várd el a mesterséges intelligenciától, hogy ezt megadja neked.”

Idén Hannah Kent, a Burial Rites és a Devotion című könyvek elismert szerzője számos ausztrál író között volt, akiket megdöbbentett, hogy művét kalózként használták a Meta mesterséges intelligencia rendszerének betanításához. Azt mondta, hogy a kreatív világba való mesterséges intelligencia általi behatolásra adott első reakciója általában „felháborodás és tiltakozás” volt, de az Audible bejelentése is felkeltette az érdeklődését – különösen a más nyelvekre történő mesterséges intelligencia általi fordítások tesztelésének tervei.

„Azt hiszem, mindenki számára világos, hogy a mesterséges intelligencia használatának fő oka a költségek csökkentése, és ez olcsóbbá teszi a dolgokat – szó szerint és kreatívan is, ami azt jelenti, hogy már nem tiszteljük úgy a történetmesélés és a művészi ihlet szellemét, mint korábban” – osztotta meg Kent.

Tudor és Swallow úgy vélik, hogy a nagyvállalatoknak nehéz lesz teljesen helyettesíteniük az emberi hangokat, részben azért, mert sok ausztrál szerző ellenállna ennek.

De hogy a hallgatók valóban meg tudják-e mondani a különbséget, az továbbra is nyitott kérdés.

(A Guardian szerint)

Forrás: https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html