"মাইন্ড ক্যাপশনিং" প্রযুক্তি মস্তিষ্কের সংকেতগুলিকে মানুষের চিন্তাভাবনা করা ছবি বা দৃশ্যের সঠিক বর্ণনায় রূপান্তরিত করে বৈজ্ঞানিক বিশ্বকে অবাক করে দিচ্ছে। এটি আমেরিকান বিজ্ঞানীদের একটি দল দ্বারা ঘোষিত একটি নতুন প্রযুক্তি - কৃত্রিম বুদ্ধিমত্তা এবং স্নায়ুবিজ্ঞানের ক্ষেত্রে একটি উল্লেখযোগ্য পদক্ষেপ: "মাইন্ড-ক্যাপশনিং" প্রযুক্তি।
এই সিস্টেমটি মস্তিষ্কের কার্যকলাপকে ডিকোড করতে পারে এবং একজন ব্যক্তি যা দেখেন বা কল্পনা করেন তা আশ্চর্যজনক নির্ভুলতার সাথে লিখিত বর্ণনায় রূপান্তর করতে পারে।
সায়েন্স অ্যাডভান্সেস জার্নালে প্রকাশিত এই গবেষণাপত্রটি মানুষের মস্তিষ্ক তার চারপাশের জগৎকে কীভাবে ব্যাখ্যা করে তা বোঝার ক্ষেত্রে নতুন দৃষ্টিভঙ্গি উন্মোচন করে। একই সাথে, এই নতুন প্রযুক্তিটি স্ট্রোকের পরে ভাষাগত ব্যাধিতে আক্রান্ত ব্যক্তিদের সহায়তা করার ক্ষেত্রে সম্ভাব্য প্রয়োগের পরামর্শও দেয়।

মাইন্ড-ক্যাপশন প্রযুক্তি মস্তিষ্কের কার্যকলাপ ডিকোড করতে পারে এবং মানুষ যা দেখে বা কল্পনা করে তা উচ্চ নির্ভুলতার সাথে টেক্সট বর্ণনায় রূপান্তর করতে পারে। (ছবি: Nature.com)
ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়ের বার্কলে (মার্কিন যুক্তরাষ্ট্র) একটি গবেষণা দলের মতে, এই কৌশলটি স্নায়ু কার্যকলাপ রেকর্ড করার জন্য নন-ইনভেসিভ ব্রেন ইমেজিং প্রযুক্তি ব্যবহার করে। বিজ্ঞানীরা এরপর উন্নত AI ভাষার মডেল ব্যবহার করে অংশগ্রহণকারী কী দেখছেন বা কল্পনা করছেন তা ভবিষ্যদ্বাণী এবং সঠিকভাবে বর্ণনা করেন।
"এই সিস্টেমটি একজন ব্যক্তি কী দেখছেন তা খুব উচ্চ স্তরে বিস্তারিতভাবে ভবিষ্যদ্বাণী করতে পারে, যা অভূতপূর্ব," কম্পিউটেশনাল স্নায়ুবিজ্ঞানী অ্যালেক্স হুথ বলেছেন।
এক দশকেরও বেশি সময় ধরে, গবেষকরা মস্তিষ্কের সংকেতের উপর ভিত্তি করে ছবি বা শব্দের ভবিষ্যদ্বাণী করার চেষ্টা করছেন। তবে, ভিডিও বা বিমূর্ত আকারের মতো জটিল বিষয়বস্তুকে ভাষায় "অনুবাদ" করা একটি বড় চ্যালেঞ্জ হিসেবে রয়ে গেছে।
পূর্ববর্তী পদ্ধতিগুলি বিষয়, ক্রিয়া এবং পারিপার্শ্বিক পরিবেশের মতো সম্পূর্ণ প্রেক্ষাপটের পরিবর্তে শুধুমাত্র একক কীওয়ার্ডকে স্বীকৃতি দিত।
এই সীমাবদ্ধতা কাটিয়ে ওঠার জন্য, NTT কমিউনিকেশনস সায়েন্স ল্যাবরেটরিজ (জাপান) এর স্নায়ুবিজ্ঞানী তোমোয়াসু হোরিকাওয়ার গবেষণা দল একটি গভীর ভাষার AI মডেল তৈরি করেছে। প্রথমে, তারা 2,000 টিরও বেশি ভিডিওর সাবটাইটেল বিশ্লেষণ করার জন্য একটি গভীর ভাষার মডেল ব্যবহার করেছে, প্রতিটি অংশকে একটি "অর্থপূর্ণ স্বাক্ষর" - ভিডিও সামগ্রীর প্রতিনিধিত্বকারী একটি ডিজিটাল গ্রাফে রূপান্তরিত করেছে।
এরপর দলটি আরেকটি AI সিস্টেমকে প্রশিক্ষণ দেয় যাতে ভিডিও দেখার সময় ছয়জন অংশগ্রহণকারীর মস্তিষ্কের কার্যকলাপের সাথে এই "অর্থপূর্ণ স্বাক্ষর" এর সংযোগ সনাক্ত করা যায়।
ফলাফলগুলি দেখিয়েছে যে AI অংশগ্রহণকারীরা যা দেখছিলেন বা কল্পনা করছিলেন তা কেবল কীওয়ার্ড তালিকাভুক্ত করার পরিবর্তে সম্পূর্ণ বর্ণনামূলক বাক্যে সঠিকভাবে "অনুবাদ" করতে পারে।
বিশেষজ্ঞরা বলছেন যে "মন-ক্যাপশনিং" প্রযুক্তি কেবল স্নায়ুবিজ্ঞান গবেষণায় একটি মাইলফলকই নয় বরং এটি ব্যাপক ব্যবহারিক প্রয়োগের সম্ভাবনাও উন্মুক্ত করে। ভবিষ্যতে, এই কৌশলটি এমন লোকদের সহায়তা করতে পারে যারা কথা বলার ক্ষমতা হারিয়ে ফেলেছেন, তাদের মস্তিষ্কের সংকেতের মাধ্যমে যোগাযোগ করতে সহায়তা করে।
যদিও এখনও প্রাথমিক পর্যায়ে আছে, "মাইন্ড-ক্যাপশনিং" মানুষের চিন্তাভাবনার ভাষা বোঝার যাত্রায় একটি বড় পদক্ষেপ হিসেবে চিহ্নিত, যা "মাইন্ড রিডিং"-এর সম্ভাবনাকে বাস্তবতার কাছাকাছি নিয়ে আসে যা কেবল বিজ্ঞান কল্পকাহিনীর সিনেমাতেই বিদ্যমান ছিল।
সূত্র: https://vtcnews.vn/cong-nghe-dot-pha-tri-tue-nhan-tao-doc-duoc-suy-nghi-con-nguoi-ar985947.html






মন্তব্য (0)