নতুন গবেষণার মাধ্যমে মানুষ বাস্তব সময়ে একটি রোবটের ক্রিয়াকলাপ সামঞ্জস্য করতে পারে, ঠিক যেমন তারা অন্য ব্যক্তিকে প্রতিক্রিয়া জানায়।
কল্পনা করুন একটি রোবট আপনাকে বাসন ধোয়ায় সাহায্য করছে। আপনি তাকে সিঙ্ক থেকে এক বাটি সাবান নিতে বলেন, কিন্তু তার গ্রিপার ঠিক যেখানে দরকার সেখানে ধরতে পারে না।
MIT এবং NVIDIA-এর গবেষকদের দ্বারা তৈরি একটি নতুন কাঠামোর সাহায্যে, আপনি সহজ অঙ্গভঙ্গির মাধ্যমে একটি রোবটের আচরণ নিয়ন্ত্রণ করতে পারেন। আপনি একটি বাটির দিকে নির্দেশ করতে পারেন, স্ক্রিনে একটি পথ আঁকতে পারেন, অথবা কেবল রোবটের বাহুকে সঠিক দিকে ঠেলে দিতে পারেন।
রোবটের আচরণ পরিবর্তনের অন্যান্য পদ্ধতির বিপরীতে, এই কৌশলটিতে ব্যবহারকারীকে নতুন তথ্য সংগ্রহ করতে হবে না এবং রোবট নিয়ন্ত্রণকারী মেশিন লার্নিং মডেলটিকে পুনরায় প্রশিক্ষণ দিতে হবে না। পরিবর্তে, এটি রোবটকে রিয়েল-টাইম, ভিজ্যুয়াল মানব প্রতিক্রিয়া ব্যবহার করে ব্যবহারকারীর অভিপ্রায়ের সাথে সবচেয়ে ভালোভাবে মেলে এমন অ্যাকশন সিকোয়েন্স নির্বাচন করতে দেয়।
গবেষকরা যখন এই কাঠামোটি পরীক্ষা করেছিলেন, তখন এর সাফল্যের হার মানুষের হস্তক্ষেপ ব্যবহার না করে বিকল্প পদ্ধতির তুলনায় ২১% বেশি ছিল।
ভবিষ্যতে, এই কাঠামোটি একজন ব্যবহারকারীর জন্য কারখানা-প্রশিক্ষিত রোবটকে বিভিন্ন গৃহস্থালীর কাজ সম্পাদনের নির্দেশ দেওয়া সহজ করে তুলতে পারে, এমনকি যদি রোবটটি আগে কখনও সেই বাড়ির পরিবেশ বা জিনিসপত্র না দেখে থাকে।
"আমরা সাধারণ ব্যবহারকারীদের কাছ থেকে তথ্য সংগ্রহ এবং একটি নিউরাল নেটওয়ার্ক মডেলকে সূক্ষ্মভাবে সুরক্ষিত করার আশা করতে পারি না। তারা আশা করে যে রোবটটি বাক্সের বাইরে থেকে কাজ করবে, এবং যদি কিছু ভুল হয়ে যায়, তবে তা সংশোধন করার জন্য তাদের একটি স্বজ্ঞাত প্রক্রিয়া প্রয়োজন। এই গবেষণাপত্রে আমরা এই চ্যালেঞ্জটি মোকাবেলা করেছি," বলেছেন ফেলিক্স ইয়ানওয়েই ওয়াং, এমআইটির বৈদ্যুতিক প্রকৌশল ও কম্পিউটার বিজ্ঞান (EECS) বিভাগের স্নাতক ছাত্র এবং গবেষণার প্রধান লেখক।
বিচ্যুতি কমিয়ে আনুন
সম্প্রতি, গবেষকরা একটি "নীতি" - একটি রোবট একটি কাজ সম্পন্ন করার জন্য অনুসরণ করে এমন নিয়মের একটি সেট - শেখার জন্য পূর্ব-প্রশিক্ষিত জেনারেটিভ এআই মডেল ব্যবহার করেছেন। এই মডেলগুলি অনেক জটিল কাজ সমাধান করতে পারে।
প্রশিক্ষণের সময়, মডেলটি কেবল বৈধ রোবট নড়াচড়ার সংস্পর্শে আসে, তাই এটি উপযুক্ত নড়াচড়ার গতিপথ তৈরি করতে শেখে।
তবে, এর অর্থ এই নয় যে রোবটের প্রতিটি পদক্ষেপ ব্যবহারকারীর প্রকৃত প্রত্যাশার সাথে মিলে যাবে। উদাহরণস্বরূপ, একটি রোবটকে হয়তো তাক থেকে বাক্সগুলি উল্টে না ফেলে তুলে নেওয়ার প্রশিক্ষণ দেওয়া হতে পারে, কিন্তু যদি প্রশিক্ষণের সময় বুকশেলফের বিন্যাসটি যা দেখেছে তার থেকে ভিন্ন হয় তবে সে কারও বুকশেলফের বাক্সে পৌঁছাতে ব্যর্থ হতে পারে।
এই ধরনের ত্রুটিগুলি ঠিক করার জন্য, ইঞ্জিনিয়াররা প্রায়শই নতুন কাজের উপর অতিরিক্ত তথ্য সংগ্রহ করেন এবং মডেলটিকে পুনরায় প্রশিক্ষণ দেন, এটি একটি ব্যয়বহুল এবং সময়সাপেক্ষ প্রক্রিয়া যার জন্য মেশিন লার্নিং দক্ষতার প্রয়োজন হয়।
পরিবর্তে, এমআইটি টিম ব্যবহারকারীদের রোবটটি ভুল করার সাথে সাথে তার আচরণ সামঞ্জস্য করার অনুমতি দিতে চায়।
তবে, যদি কোনও মানুষ রোবটের সিদ্ধান্ত গ্রহণ প্রক্রিয়ায় হস্তক্ষেপ করে, তাহলে এটি দুর্ঘটনাক্রমে জেনারেটিভ মডেলটিকে একটি অবৈধ পদক্ষেপ বেছে নিতে বাধ্য করতে পারে। রোবটটি মানুষের পছন্দের বাক্সটি পেতে পারে, কিন্তু এই প্রক্রিয়ায় তাকের বইগুলিকে ধাক্কা দিতে পারে।
"আমরা চাই ব্যবহারকারীরা এই ধরনের ত্রুটি না করেই রোবটের সাথে যোগাযোগ করুক, যার ফলে ব্যবহারকারীর উদ্দেশ্যের সাথে আরও ভালোভাবে মেলে এমন আচরণ অর্জন করা যায়, একই সাথে বৈধতা এবং সম্ভাব্যতা নিশ্চিত করা যায়," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
সিদ্ধান্ত গ্রহণের ক্ষমতা বৃদ্ধি করুন
এই মিথস্ক্রিয়াগুলি যাতে রোবটকে অবৈধ পদক্ষেপ নিতে না বাধ্য করে তা নিশ্চিত করার জন্য, দলটি একটি বিশেষ নমুনা পদ্ধতি ব্যবহার করে। এই কৌশলটি মডেলটিকে ব্যবহারকারীর লক্ষ্যের সাথে সবচেয়ে ভালোভাবে মেলে এমন বৈধ পছন্দগুলির একটি সেট থেকে পদক্ষেপটি বেছে নিতে সহায়তা করে।
"ব্যবহারকারীর উদ্দেশ্য চাপিয়ে দেওয়ার পরিবর্তে, আমরা রোবটকে তাদের উদ্দেশ্য বুঝতে সাহায্য করি, একই সাথে নমুনা প্রক্রিয়াটি তার শেখা আচরণের উপর নির্ভর করে ওঠানামা করতে দিই," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
এই পদ্ধতির জন্য ধন্যবাদ, তাদের গবেষণা কাঠামো সিমুলেশন পরীক্ষা-নিরীক্ষার পাশাপাশি একটি মডেল রান্নাঘরে একটি বাস্তব রোবোটিক হাত দিয়ে পরীক্ষার ক্ষেত্রে অন্যান্য পদ্ধতিগুলিকে ছাড়িয়ে গেছে।
যদিও এই পদ্ধতিটি সর্বদা তাৎক্ষণিকভাবে কাজটি সম্পন্ন করে না, তবে ব্যবহারকারীর জন্য এর একটি বড় সুবিধা রয়েছে: রোবটটি কাজটি সম্পন্ন করার জন্য অপেক্ষা করার এবং তারপরে নতুন নির্দেশনা দেওয়ার পরিবর্তে, তারা কোনও ত্রুটি সনাক্ত করার সাথে সাথে রোবটটি সংশোধন করতে পারে।
উপরন্তু, ব্যবহারকারী রোবটটিকে কয়েকবার আলতো করে ধাক্কা দেওয়ার পর, সঠিক বাটিটি তুলে নেওয়ার জন্য, রোবটটি সেই সংশোধনটি মনে রাখতে পারে এবং ভবিষ্যতের শিক্ষায় এটি অন্তর্ভুক্ত করতে পারে, যাতে পরের দিন রোবটটি আবার নির্দেশিত না হয়েই সঠিক বাটিটি তুলে নিতে পারে।
"কিন্তু এই ক্রমাগত উন্নতির মূল চাবিকাঠি হল ব্যবহারকারীদের রোবটের সাথে যোগাযোগ করার জন্য একটি ব্যবস্থা থাকা, এবং এই গবেষণায় আমরা ঠিক এটাই দেখিয়েছি," ফেলিক্স ইয়ানওয়েই ওয়াং বলেন।
ভবিষ্যতে, দলটি কর্মক্ষমতা বজায় রেখে বা উন্নত করে নমুনা প্রক্রিয়াটি দ্রুততর করতে চায়। তারা রোবটের অভিযোজনযোগ্যতা মূল্যায়নের জন্য নতুন পরিবেশে পদ্ধতিটি পরীক্ষা করতেও চায়।
(সূত্র: এমআইটি নিউজ)
[বিজ্ঞাপন_২]
সূত্র: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html
মন্তব্য (0)