পাঠ ৫৮.png এর ছবি
ছবি: মিডজার্নি

যখন আমরা ভাবি কোন কোন জিনিস একটা অডিওবুককে স্মরণীয় করে তোলে, তখন সবসময়ই মানুষের সেই মুহূর্তগুলো আসে: চোখের জল গড়ে ওঠার সময়ের হাঁফ, অথবা সত্যিকারের হাসি দিয়ে বলা কথাগুলো।

মেলবোর্ন-ভিত্তিক অভিনেত্রী এবং অডিওবুক পাঠক অ্যানাবেল টিউডর বলেন, গল্প বলার প্রতি আমাদের মানবিক প্রবৃত্তিই অডিওবুক পড়াকে এত আদিম এবং মূল্যবান দক্ষতায় পরিণত করে। "আমাদের কণ্ঠস্বর আমাদের আবেগকে এত সহজেই প্রতিফলিত করে," তিনি বলেন।

কিন্তু শিল্পের একটি রূপ হিসেবে, এটি হুমকির মুখে পড়তে পারে। মে মাসে, অ্যামাজনের মালিকানাধীন অডিওবুক কোম্পানি অডিবল ঘোষণা করেছিল যে তারা লেখক এবং প্রকাশকদের ইংরেজি, স্প্যানিশ, ফরাসি এবং ইতালীয় ভাষায় অডিওবুক পড়ার জন্য ১০০ টিরও বেশি এআই-জেনারেটেড ভয়েস থেকে বেছে নেওয়ার অনুমতি দেবে। এ বছরের শেষের দিকে এআই অডিওবুক অনুবাদও চালু হওয়ার কথা রয়েছে - এমন একটি খবর যা প্রকাশনা শিল্পে সমালোচনা এবং কৌতূহল উভয়ই জাগিয়ে তুলেছে।

অস্ট্রেলিয়ায় - যেখানে অডিওবুক প্রযোজনা কোম্পানির সংখ্যা কম এবং টিউডরের মতো উদীয়মান অভিনেতারা জীবিকা নির্বাহের জন্য কাজের উপর নির্ভর করেন - চাকরি হারানো, স্বচ্ছতা এবং গুণমান নিয়ে উদ্বেগ বাড়ছে।

টিউডর, যিনি ৪৮টি বই পড়েছেন, তিনি নিশ্চিত নন যে এআই তার কাজ করতে পারে, তবে তিনি উদ্বিগ্ন যে নিম্নমানের কারণে জনসাধারণ এই ফর্ম্যাট থেকে দূরে সরে যেতে পারে।

অডিওবুক বুম

NielsenIQ-এর Bookdata 2024 রিপোর্ট অনুসারে, অস্ট্রেলিয়ার অর্ধেকেরও বেশি অডিওবুক শ্রোতা গত পাঁচ বছরে তাদের শোনার সময় বাড়িয়েছেন। বিশ্বব্যাপী, মার্কিন যুক্তরাষ্ট্রে অডিওবুক বিক্রি 2023 থেকে 2024 সাল পর্যন্ত 13% বৃদ্ধি পাবে; ব্রিটিশ পাবলিশার্স অ্যাসোসিয়েশনের মতে, যুক্তরাজ্যে অডিওবুক আয় £268 মিলিয়নের নতুন সর্বোচ্চে পৌঁছাবে, যা 2023 থেকে 31% বেশি।

চাহিদা বৃদ্ধির সাথে সাথে, কোম্পানিগুলি দ্রুত এবং সস্তায় এগুলি তৈরি করার চেষ্টা করে। ২০২৩ সালের জানুয়ারিতে, অ্যাপল এআই ভয়েস সহ একটি নতুন অডিওবুক ক্যাটালগ চালু করে। সেই বছরের শেষের দিকে, অ্যামাজন মার্কিন যুক্তরাষ্ট্রে স্ব-প্রকাশিত লেখকদের কিন্ডল বই সহ তাদের ই-বুকগুলিকে এআই "ভার্চুয়াল ভয়েস" প্রযুক্তি ব্যবহার করে অডিওবুকে রূপান্তর করার অনুমতি দেয় - এবং এখন হাজার হাজার কম্পিউটার-পাঠযোগ্য অডিওবুক অডিবলের মাধ্যমে বিতরণ করা হয়।

ফেব্রুয়ারিতে, স্পটিফাই ঘোষণা করেছিল যে তারা AI-পঠিত অডিওবুক গ্রহণ করবে, যার লক্ষ্য হল আরও বেশি পাঠকের কাছে পৌঁছাতে চাওয়া লেখকদের "প্রবেশের বাধা কমানো"। অডিবল বলেছে যে এর লক্ষ্য একই রকম: মানুষের কণ্ঠস্বরকে পরিপূরক করা, প্রতিস্থাপন করা নয়, আরও লেখক এবং শিরোনামকে বৃহত্তর শ্রোতাদের কাছে পৌঁছানোর সুযোগ করে দেওয়া। মার্কিন যুক্তরাষ্ট্রে, অডিবল একটি ভয়েস-ক্লোনিং বৈশিষ্ট্যও পরীক্ষা করছে যা পাঠকদের উচ্চ-মানের অডিওবুক উৎপাদন সম্প্রসারণের জন্য তাদের নিজস্ব কণ্ঠস্বরের সংস্করণ তৈরি করতে দেয়।

"২০২৩ এবং ২০২৪ সালে, অডিবল স্টুডিও আগের চেয়ে আরও বেশি পাঠক নিয়োগ করবে," একজন অডিবল মুখপাত্র গার্ডিয়ানকে বলেন। "আমরা এমন লেখকদের কাছ থেকে অনুরোধ পাচ্ছি যারা তাদের কাজ অডিওতে আনতে চান, একাধিক ভাষায় নতুন শ্রোতাদের কাছে পৌঁছাতে চান।"

কিন্তু রোবটের কণ্ঠস্বর সবসময় মানুষের কণ্ঠস্বরের চেয়ে সস্তা হবে - এবং ভয়েসওভার এবং প্রকাশনা পেশাদাররা আশঙ্কা করছেন যে AI প্রবণতা তাদের চাকরিকে হুমকির মুখে ফেলবে।

ব্যাপক উৎপাদন নাকি গুণমানের নিশ্চয়তা?

অস্ট্রেলিয়ার সর্বাধিক বিক্রিত অপরাধ লেখক ক্রিস হ্যামারের উপন্যাসগুলিতে কণ্ঠ দেওয়ার পর ডোরজে সোয়ালোর অডিওবুক ক্যারিয়ার শুরু হয়, যে উপন্যাসগুলির মধ্যে তিনি প্রায় ৭০টি পড়েছেন। সোয়ালো বলেন, এআই অডিওবুক এমন লোকদের জন্য একটি হাতিয়ার যারা "একটি মানসম্পন্ন অডিওবুক তৈরির জন্য প্রয়োজনীয় মূল্য, কৌশল এবং দক্ষতা বোঝেন না"।

"আমরা আজ যেখানে আছি সেখানে পৌঁছানোর জন্য এত কঠোর পরিশ্রম এবং অনেক ত্যাগ স্বীকার করেছি, এবং ভাবছি যে আপনি কেবল একটি বোতাম টিপে সমতুল্য, বা যথেষ্ট ভালো কিছু পেতে পারেন - এটা হাস্যকর," তিনি বলেন।

অস্ট্রেলিয়ান ভয়েস অ্যাক্টরস গিল্ডের সভাপতি সাইমন কেনেডি বলেন, অডিওবুক পাঠকদের কত টাকা দেওয়া উচিত তা নিয়ে দীর্ঘদিন ধরে বিতর্ক চলছে। এক ঘন্টা অডিওবুক শেষ করতে প্রায়শই অভিনেতাদের দুই বা তিনগুণ বেশি সময় লাগে, বিষয়বস্তু এবং চরিত্রগুলি বুঝতে আগে থেকে এটি পড়তে যে সময় লাগে তা তো বাদই দিলাম। "আমার মতে, এআই ভয়েস ব্যবহার করা মানে মানের চেয়ে পরিমাণকে প্রাধান্য দেওয়া - এবং এটি পুরো প্রক্রিয়াটিকে সস্তা করে তোলে," তিনি বলেন।

কেনেডি ২০২৪ সালে কৃত্রিম বুদ্ধিমত্তা প্রতিস্থাপনের হুমকি মোকাবেলায় অস্ট্রেলিয়ান ভয়েস অ্যাক্টরস অ্যাসোসিয়েশন প্রতিষ্ঠা করেন। গত বছর একটি সংসদীয় কমিটির কাছে দেওয়া এক প্রতিবেদনে, সংস্থাটি বলেছিল যে অস্ট্রেলিয়ায় ৫,০০০ ভয়েস অ্যাক্টিং চাকরি ঝুঁকির মধ্যে রয়েছে।

"আপনি যদি শুরু থেকে শেষ পর্যন্ত একটি সমতল, একঘেয়ে কণ্ঠস্বর চান এবং এটিকে 'উচ্চ মানের' বলেন, তাহলে ঠিক আছে," তিনি বলেন। "কিন্তু আপনি যদি এমন একটি আকর্ষণীয়, আকর্ষণীয় গল্প খুঁজছেন যা আপনাকে আপনার আসনের কিনারায় রাখবে - তাহলে আশা করবেন না যে AI আপনাকে তা দেবে।"

এই বছর, Burial Rites and Devotion-এর প্রশংসিত লেখিকা হান্না কেন্ট, অস্ট্রেলিয়ার বেশ কয়েকজন লেখকের মধ্যে ছিলেন যারা মেটার AI সিস্টেমকে প্রশিক্ষণ দেওয়ার জন্য তার কাজ পাইরেট করা হয়েছে জেনে হতবাক হয়ে গিয়েছিলেন। তিনি বলেছিলেন যে সৃজনশীল ক্ষেত্রে AI অনুপ্রবেশের প্রতি তার প্রাথমিক প্রতিক্রিয়া সাধারণত "ক্ষোভ এবং প্রতিবাদ" ছিল, তবে তিনি Audible-এর ঘোষণায়ও আগ্রহী ছিলেন - বিশেষ করে অন্যান্য ভাষায় AI অনুবাদ পরীক্ষা করার পরিকল্পনা।

"আমি মনে করি এটা সবার কাছে স্পষ্ট যে AI ব্যবহারের মূল কারণ হল খরচ কমানো, এবং এটি জিনিসগুলিকে সস্তা করে তুলবে - আক্ষরিক এবং সৃজনশীল উভয় দিক থেকেই, যার অর্থ আমরা আর আগের মতো গল্প বলার এবং শৈল্পিক অনুপ্রেরণার চেতনাকে সম্মান করি না," কেন্ট শেয়ার করেছেন।

টিউডর এবং সোয়ালো বিশ্বাস করেন যে বৃহৎ কোম্পানিগুলির পক্ষে মানুষের কণ্ঠস্বর সম্পূর্ণরূপে প্রতিস্থাপন করা কঠিন হবে, কারণ অনেক অস্ট্রেলিয়ান লেখক এটির বিরোধিতা করবেন।

কিন্তু শ্রোতারা আসলে পার্থক্যটি বুঝতে পারবেন কিনা তা এখনও একটি উন্মুক্ত প্রশ্ন।

(দ্য গার্ডিয়ানের মতে)

সূত্র: https://vietnamnet.vn/noi-lo-ai-lam-giam-chat-luong-sach-noi-2419249.html