মোটর নিউরন রোগে (এমএনডি) আক্রান্ত একজন ব্রিটিশ মহিলা, যার কারণে তিনি কথা বলতে পারতেন না, কৃত্রিম বুদ্ধিমত্তা (এআই) প্রযুক্তি এবং একটি পুরনো পারিবারিক ভিডিও থেকে নেওয়া আট সেকেন্ডের রেকর্ডিংয়ের মাধ্যমে আবার নিজের কণ্ঠস্বর ব্যবহার করে যোগাযোগ করতে সক্ষম হয়েছেন।
উত্তর লন্ডনে বসবাসকারী একজন শিল্পী সারাহ ইজেকিয়েল, ২৫ বছর আগে তার দ্বিতীয় সন্তানের গর্ভবতী হওয়ার সময় ৩৪ বছর বয়সে MND রোগ নির্ণয়ের পর কথা বলার ক্ষমতা হারিয়ে ফেলেন।
এই রোগটি স্নায়ুতন্ত্রের ক্ষতি করে, জিহ্বা, মুখ এবং গলার পেশীগুলিকে দুর্বল করে দেয়, যার ফলে কিছু রোগী কথা বলার ক্ষমতা সম্পূর্ণরূপে হারিয়ে ফেলে।
বছরের পর বছর ধরে, ইজেকিয়েল যোগাযোগের জন্য একটি কম্পিউটার এবং ভয়েস-জেনারেটিং প্রযুক্তি ব্যবহার করেছিলেন, কিন্তু কণ্ঠস্বরটি তার মতো শোনাচ্ছিল না। তার দুই সন্তান, আভিভা এবং এরিক, তাদের মায়ের আসল কণ্ঠস্বর কখনও না জেনেই বেড়ে ওঠে।
সাম্প্রতিক বছরগুলিতে, বিশেষজ্ঞরা প্রযুক্তি ব্যবহার করে একজন ব্যক্তির আসল কণ্ঠস্বর পুনরায় তৈরি করতে সক্ষম হয়েছেন। তবে, এই কৌশলটির জন্য দীর্ঘ, উচ্চ-মানের রেকর্ডিং প্রয়োজন এবং ফলস্বরূপ কণ্ঠস্বরকে প্রায়শই "একঘেয়ে" বলে মনে করা হয়।
ব্রিটিশ মেডিকেল মিডিয়া কোম্পানি স্মার্টবক্সের প্রতিনিধি সাইমন পুল বলেন, কোম্পানিটি প্রথমে মিসেস এজেকিয়েলকে ৬০ মিনিটের একটি রেকর্ডিং দিতে বলেছিল।
তবে, মিসেস ইজেকিয়েল কেবল একটি খুব ছোট এবং নিম্নমানের ক্লিপ খুঁজে পান, যা ১৯৯০-এর দশকের একটি হোম ভিডিও থেকে নেওয়া হয়েছিল। ক্লিপটি মাত্র ৮ সেকেন্ড দীর্ঘ ছিল, বিকৃত শব্দ ছিল এবং টিভি থেকে শব্দ আসছিল।
মিঃ পুল নিউ ইয়র্ক-ভিত্তিক এআই ভয়েস-জেনারেশন কোম্পানি ইলেভেনল্যাবস দ্বারা তৈরি প্রযুক্তির দিকে ঝুঁকে পড়েন, যা খুব কম তথ্য ব্যবহার করে বাস্তবসম্মত ভয়েস পুনরায় তৈরি করতে পারে।
মিঃ পুল পুরাতন রেকর্ডিং থেকে ভয়েস বের করার জন্য একটি এআই টুল ব্যবহার করেছিলেন, তারপর চূড়ান্ত পণ্য তৈরি করতে আরেকটি টুল - আসল ভয়েস ডেটার উপর প্রশিক্ষিত - ব্যবহার করেছিলেন।
ফলাফলগুলি মিসেস ইজেকিয়েলকে গভীরভাবে নাড়া দিয়েছিল। পুনঃনির্মিত কণ্ঠস্বরটি তার নিজের মতোই ছিল, এর স্বতন্ত্র লন্ডন উচ্চারণ এবং সামান্য ক্ষীণ স্বরে যা তিনি আগে অপছন্দ করেছিলেন।
MND UK-এর মতে, রোগ নির্ণয়ের পর প্রতি ১০ জনের মধ্যে আটজন ব্যক্তির কথা বলার অসুবিধা হয়। তবে, বর্তমান কম্পিউটার-উত্পাদিত কণ্ঠস্বরগুলিতে প্রায়শই ছন্দ এবং আবেগের অভাব রয়েছে বলে বিচার করা হয়।
মিঃ পুল বলেন, আজকের কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির অগ্রগতির মূল কারণ হলো মানুষের মতো এবং আবেগপূর্ণ কণ্ঠস্বর তৈরি করা, যার ফলে পূর্বে শুষ্ক কম্পিউটার কণ্ঠস্বরে "প্রাণ সঞ্চার" করা সম্ভব। তিনি জোর দিয়ে বলেন যে কণ্ঠস্বরকে ব্যক্তিগতকৃত করাও ব্যক্তিগত পরিচয় সংরক্ষণের একটি উপায়।
MND-এর মতো অবস্থার কারণে কথা বলার ক্ষমতা হারানোর ঝুঁকিতে থাকা ব্যক্তিদের এখন প্রায়শই তাদের পরিচয় সংরক্ষণ এবং ভবিষ্যতে যোগাযোগের সুবিধার্থে যত তাড়াতাড়ি সম্ভব তাদের কণ্ঠস্বর রেকর্ড করতে উৎসাহিত করা হয়।
তবে, স্মার্টফোন জনপ্রিয় হওয়ার আগে, সঠিক রেকর্ডিং পাওয়া সহজ ছিল না।/।
সূত্র: https://www.vietnamplus.vn/ai-tai-tao-giong-noi-cho-mot-phu-nu-anh-mat-kha-nang-noi-25-nam-post1057350.vnp






মন্তব্য (0)