নতুন গবেষণার মাধ্যমে মানুষ বাস্তব সময়ে রোবটের ক্রিয়াগুলিকে সামঞ্জস্য করতে পারে, ঠিক যেমন তারা অন্য ব্যক্তিকে প্রতিক্রিয়া জানায়।

কল্পনা করুন একটি রোবট আপনাকে বাসন ধোয়ার কাজে সাহায্য করছে। আপনি তাকে সিঙ্ক থেকে এক বাটি সাবান তুলতে বলেন, কিন্তু তার গ্রিপাররা প্রয়োজনে ঠিকভাবে সাবান ধরতে পারে না।
MIT এবং NVIDIA-এর গবেষকদের দ্বারা তৈরি একটি নতুন পদ্ধতিগত কাঠামোর সাহায্যে, আপনি সহজ অঙ্গভঙ্গির মাধ্যমে রোবটের আচরণ নিয়ন্ত্রণ করতে পারেন। আপনি বাটির দিকে নির্দেশ করতে পারেন অথবা স্ক্রিনে একটি পথ আঁকতে পারেন, অথবা রোবটের বাহুটিকে আলতো করে সঠিক দিকে ঠেলে দিতে পারেন।
অন্যান্য রোবট আচরণ পরিবর্তন পদ্ধতির বিপরীতে, এই কৌশলটিতে ব্যবহারকারীদের নতুন তথ্য সংগ্রহ করতে হবে না এবং রোবট নিয়ন্ত্রণকারী মেশিন লার্নিং মডেলটিকে পুনরায় প্রশিক্ষণ দিতে হবে না। পরিবর্তে, এটি রোবটকে রিয়েল-টাইম, স্বজ্ঞাত মানব প্রতিক্রিয়া ব্যবহার করে ব্যবহারকারীর উদ্দেশ্যের সাথে সর্বোত্তমভাবে সামঞ্জস্যপূর্ণ কর্মের ক্রম নির্বাচন করতে দেয়।
গবেষকরা যখন এই পদ্ধতিগত কাঠামোটি পরীক্ষা করেছিলেন, তখন এর সাফল্যের হার মানুষের হস্তক্ষেপ ব্যবহার না করে এমন বিকল্প পদ্ধতির তুলনায় ২১% বেশি ছিল।
ভবিষ্যতে, এই পদ্ধতিগত কাঠামো ব্যবহারকারীদের জন্য কারখানা-প্রশিক্ষিত রোবটকে বিভিন্ন গৃহস্থালীর কাজ সম্পাদনের জন্য নির্দেশনা দেওয়া সহজ করে তুলতে পারে, এমনকি যদি রোবটটি আগে কখনও সেই বাড়ির পরিবেশ বা জিনিসপত্র না দেখে থাকে।
"আমরা আশা করতে পারি না যে গড় ব্যবহারকারী ম্যানুয়ালি ডেটা সংগ্রহ করবেন এবং একটি নিউরাল নেটওয়ার্ক মডেলকে সূক্ষ্মভাবে সুরক্ষিত করবেন। তারা আশা করবে যে রোবটটি বাক্সের বাইরে কাজ করবে, এবং যদি কোনও ত্রুটি দেখা দেয়, তবে এটি সামঞ্জস্য করার জন্য তাদের একটি স্বজ্ঞাত প্রক্রিয়া প্রয়োজন। এই গবেষণায় আমরা এই চ্যালেঞ্জটি মোকাবেলা করেছি," বলেছেন ফেলিক্স ইয়ানওয়েই ওয়াং, এমআইটি-তে বৈদ্যুতিক প্রকৌশল এবং কম্পিউটার বিজ্ঞান (EECS) এর স্নাতক ছাত্র এবং গবেষণার প্রধান লেখক।
বিচ্যুতি কমিয়ে আনুন
সম্প্রতি, গবেষকরা একটি "নীতি" - রোবটরা একটি কাজ সম্পন্ন করার জন্য যে নিয়মগুলি অনুসরণ করে তা শেখার জন্য পূর্ব-প্রশিক্ষিত জেনারেটিভ এআই মডেল ব্যবহার করেছেন। এই মডেলগুলি অনেক জটিল কাজ সমাধান করতে পারে।
প্রশিক্ষণের সময়, মডেলটি কেবল বৈধ রোবট নড়াচড়ার সংস্পর্শে আসে, তাই এটি উপযুক্ত গতিপথ তৈরি করতে শেখে।
তবে, এর অর্থ এই নয় যে রোবটের প্রতিটি কাজ বাস্তবে ব্যবহারকারীর ইচ্ছার সাথে সামঞ্জস্যপূর্ণ হবে। উদাহরণস্বরূপ, একটি রোবটকে হয়তো তাক থেকে বাক্সগুলি উল্টে না ফেলে উদ্ধার করার প্রশিক্ষণ দেওয়া হতে পারে, কিন্তু যদি প্রশিক্ষণের সময় বুকশেলফের বিন্যাসটি যা দেখেছে তার থেকে ভিন্ন হয় তবে সে কারও বুকশেলফের বাক্সে পৌঁছাতে ব্যর্থ হতে পারে।
এই ধরনের ত্রুটিগুলি কাটিয়ে ওঠার জন্য, ইঞ্জিনিয়াররা সাধারণত নতুন কাজের উপর আরও তথ্য সংগ্রহ করেন এবং মডেলটিকে পুনরায় প্রশিক্ষণ দেন, এটি একটি ব্যয়বহুল এবং সময়সাপেক্ষ প্রক্রিয়া যার জন্য মেশিন লার্নিংয়ে দক্ষতার প্রয়োজন হয়।
পরিবর্তে, এমআইটির গবেষণা দল ব্যবহারকারীদের রোবটটি ভুল করার সাথে সাথে তার আচরণ সামঞ্জস্য করার অনুমতি দিতে চায়।
তবে, যদি মানুষ রোবটের সিদ্ধান্ত গ্রহণ প্রক্রিয়ায় হস্তক্ষেপ করে, তাহলে এটি অসাবধানতাবশত জেনারেটিভ মডেলকে একটি অবৈধ পদক্ষেপ বেছে নিতে বাধ্য করতে পারে। রোবট ব্যবহারকারীর পছন্দের বাক্সটি পুনরুদ্ধার করতে পারে, কিন্তু এই প্রক্রিয়ায় তাকের বইগুলিকে ধাক্কা দিতে পারে।
"আমরা চাই ব্যবহারকারীরা এই ধরনের ভুল না করেই রোবটের সাথে যোগাযোগ করুক, যার ফলে ব্যবহারকারীর অভিপ্রায়ের সাথে আরও সামঞ্জস্যপূর্ণ আচরণ অর্জন করা যায়, একই সাথে বৈধতা এবং সম্ভাব্যতা নিশ্চিত করা যায়," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
সিদ্ধান্ত গ্রহণের ক্ষমতা বৃদ্ধি করুন
এই মিথস্ক্রিয়াগুলি যাতে রোবটকে অবৈধ ক্রিয়া সম্পাদন করতে না বাধ্য করে তা নিশ্চিত করার জন্য, গবেষণা দল একটি বিশেষ নমুনা প্রক্রিয়া ব্যবহার করেছে। এই কৌশলটি মডেলটিকে ব্যবহারকারীর লক্ষ্যের জন্য সবচেয়ে উপযুক্ত বৈধ বিকল্পগুলির একটি সেট থেকে একটি ক্রিয়া নির্বাচন করতে সহায়তা করে।
"ব্যবহারকারীর উপর আমাদের ইচ্ছা চাপিয়ে দেওয়ার পরিবর্তে, আমরা রোবটকে তাদের উদ্দেশ্য বুঝতে সাহায্য করি এবং নমুনা প্রক্রিয়াটিকে তার শেখা আচরণের উপর নির্ভর করে ওঠানামা করার অনুমতি দিই," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
এই পদ্ধতির জন্য ধন্যবাদ, তাদের গবেষণা কাঠামো সিমুলেশন পরীক্ষা-নিরীক্ষার পাশাপাশি একটি মডেল রান্নাঘরে প্রকৃত রোবোটিক অস্ত্র দিয়ে পরীক্ষার ক্ষেত্রে অন্যান্য পদ্ধতিকে ছাড়িয়ে গেছে।
যদিও এই পদ্ধতিটি সর্বদা তাৎক্ষণিকভাবে কাজটি সম্পন্ন করে না, তবে এটি ব্যবহারকারীদের জন্য একটি উল্লেখযোগ্য সুবিধা প্রদান করে: নতুন নির্দেশনা দেওয়ার আগে রোবটটি কাজটি সম্পন্ন করার জন্য অপেক্ষা করার পরিবর্তে, তারা কোনও ত্রুটি সনাক্ত করার সাথে সাথে রোবটটি ঠিক করতে পারে।
অধিকন্তু, ব্যবহারকারী যখন রোবটটিকে কয়েকবার আলতো করে ধাক্কা দিয়ে সঠিক বাটিটি তুলে নেওয়ার নির্দেশ দেয়, তখন রোবটটি সেই সংশোধনমূলক ক্রিয়াটি মনে রাখতে পারে এবং এটিকে তার ভবিষ্যতের শেখার প্রক্রিয়ায় একীভূত করতে পারে। ফলস্বরূপ, পরের দিন, রোবটটি আরও নির্দেশের প্রয়োজন ছাড়াই সঠিক বাটিটি তুলতে পারে।
"কিন্তু এই ক্রমাগত উন্নতির মূল চাবিকাঠি হল ব্যবহারকারীদের রোবটের সাথে যোগাযোগ করার জন্য একটি ব্যবস্থা থাকা, এবং আমরা এই গবেষণায় ঠিক এটাই দেখিয়েছি," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
ভবিষ্যতে, গবেষণা দলটির লক্ষ্য হল নমুনা সংগ্রহ প্রক্রিয়ার গতি বৃদ্ধি করা, দক্ষতা বজায় রাখা বা উন্নত করা। তারা রোবটের অভিযোজনযোগ্যতা মূল্যায়নের জন্য নতুন পরিবেশে এই পদ্ধতিটি পরীক্ষা করতেও চায়।
(সূত্র: এমআইটি নিউজ)
[বিজ্ঞাপন_২]
সূত্র: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






মন্তব্য (0)