মোটর নিউরন রোগে (এমএনডি) আক্রান্ত একজন ব্রিটিশ মহিলা, যার কারণে তিনি কথা বলার ক্ষমতা হারিয়ে ফেলেছিলেন, তিনি কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তি এবং একটি পুরনো পারিবারিক ভিডিও থেকে ৮ সেকেন্ডের অডিও রেকর্ডিংয়ের মাধ্যমে নিজের কণ্ঠস্বর ব্যবহার করে আবার যোগাযোগ করতে সক্ষম হয়েছেন।
উত্তর লন্ডনে বসবাসকারী একজন শিল্পী সারাহ ইজেকিয়েল, ২৫ বছর আগে তার দ্বিতীয় সন্তানের গর্ভবতী হওয়ার সময় ৩৪ বছর বয়সে MND রোগ নির্ণয়ের পর কথা বলার ক্ষমতা হারিয়ে ফেলেন।
এই রোগ স্নায়ুতন্ত্রের ক্ষতি করে, জিহ্বা, মুখ এবং গলার পেশী দুর্বল করে দেয়, যার ফলে কিছু রোগী সম্পূর্ণরূপে কথা বলার ক্ষমতা হারিয়ে ফেলে।
বহু বছর ধরে, ইজেকিয়েলকে যোগাযোগের জন্য কম্পিউটার এবং ভয়েস-জেনারেটিং প্রযুক্তি ব্যবহার করতে হয়েছিল, কিন্তু এর ফলে যে কণ্ঠস্বর বের হয়েছিল তা তার নিজের মতো শোনাচ্ছিল না। তার দুই সন্তান, আভিভা এবং এরিক, তাদের মায়ের আসল কণ্ঠস্বর কখনও না জেনে বড় হয়েছে।
সাম্প্রতিক বছরগুলিতে, বিশেষজ্ঞরা প্রযুক্তি ব্যবহার করে একজন ব্যক্তির আসল কণ্ঠস্বর পুনরায় তৈরি করতে সক্ষম হয়েছেন। তবে, এই কৌশলটির জন্য দীর্ঘ, উচ্চ-মানের রেকর্ডিং প্রয়োজন, এবং ফলস্বরূপ কণ্ঠস্বর প্রায়শই "একঘেয়ে" বলে বিবেচিত হয়।
ব্রিটিশ স্বাস্থ্য যোগাযোগ সংস্থা স্মার্টবক্সের প্রতিনিধিত্বকারী সাইমন পুল বলেন, সংস্থাটি প্রাথমিকভাবে ইজেকিয়েলকে ৬০ মিনিটের একটি অডিও রেকর্ডিং প্রদানের জন্য অনুরোধ করেছিল।
তবে, মিসেস ইজেকিয়েল কেবল একটি খুব ছোট, নিম্নমানের ক্লিপ খুঁজে পেয়েছেন, যা ১৯৯০-এর দশকের একটি পারিবারিক ভিডিও থেকে নেওয়া হয়েছিল। ক্লিপটি মাত্র ৮ সেকেন্ড দীর্ঘ, বিকৃত এবং টেলিভিশনের পটভূমির শব্দ ছিল।
মিঃ পুলকে নিউ ইয়র্ক-ভিত্তিক এআই স্পিচ জেনারেটর, ইলেভেনল্যাবস দ্বারা তৈরি প্রযুক্তির দিকে ঝুঁকতে হয়েছিল। এই প্রযুক্তি খুব কম তথ্য ব্যবহার করে বাস্তবসম্মত বক্তৃতা পুনরুত্পাদন করতে সক্ষম।
মিঃ পুল পুরনো রেকর্ডিং থেকে ভয়েস আলাদা করার জন্য একটি এআই টুল ব্যবহার করেছিলেন, তারপর চূড়ান্ত পণ্য তৈরি করতে অন্য একটি টুল ব্যবহার করেছিলেন - আসল ভয়েস ডেটা দিয়ে প্রশিক্ষিত।
ফলাফলটি মিসেস ইজেকিয়েলকে গভীরভাবে নাড়া দিয়েছিল। পুনর্গঠিত কণ্ঠস্বরটি তার আসল কণ্ঠস্বরের সাথে খুব মিল ছিল, যার একটি স্বতন্ত্র লন্ডন উচ্চারণ ছিল এবং সামান্য ক্ষীণ স্বর ছিল যা তিনি আগে অপছন্দ করেছিলেন।
যুক্তরাজ্যের এমএনডি অ্যাসোসিয়েশনের মতে, এই রোগে আক্রান্ত দশজনের মধ্যে আটজনই রোগ নির্ণয়ের পরে কথা বলতে অসুবিধা অনুভব করেন। তবে, বর্তমান কম্পিউটার-উত্পাদিত কণ্ঠস্বর প্রায়শই ছন্দ এবং আবেগের অভাবের জন্য সমালোচিত হয়।
মিঃ পুল বলেন যে কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির বর্তমান অগ্রগতির মূল কারণ হলো মানুষের মতো এবং অভিব্যক্তিপূর্ণ কণ্ঠস্বর তৈরি করা, যার ফলে পূর্বে একঘেয়ে কম্পিউটার কণ্ঠস্বরে "প্রাণ সঞ্চারিত" হয়। তিনি জোর দিয়ে বলেন যে কণ্ঠস্বর ব্যক্তিগতকরণও ব্যক্তিগত পরিচয় সংরক্ষণের একটি উপায়।
বর্তমানে, MND-এর মতো অবস্থার কারণে কথা বলার ক্ষমতা হারানোর ঝুঁকিতে থাকা ব্যক্তিদের প্রায়শই তাদের ব্যক্তিগত পরিচয় সংরক্ষণ এবং ভবিষ্যতে যোগাযোগের উদ্দেশ্যে যত তাড়াতাড়ি সম্ভব তাদের কণ্ঠস্বর রেকর্ড করতে উৎসাহিত করা হয়।
তবে, স্মার্টফোন ব্যাপকভাবে ছড়িয়ে পড়ার আগে, উপযুক্ত অডিও রেকর্ডিং পাওয়া সহজ ছিল না।
সূত্র: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






মন্তব্য (0)