image bài 19.jpg
فيليكس يانوي وانغ - طالب دراسات عليا في الهندسة الكهربائية وعلوم الحاسوب في معهد ماساتشوستس للتكنولوجيا. المصدر: أخبار معهد ماساتشوستس للتكنولوجيا

تخيل روبوتًا يساعدك في غسل الأطباق. تطلب منه إحضار وعاء من الصابون من الحوض، لكن أذرعه لا تمسكه بدقة في المكان المطلوب.

بفضل إطار عمل منهجي جديد طوره باحثون في معهد ماساتشوستس للتكنولوجيا وشركة إنفيديا، يمكنك التحكم في سلوك الروبوت بإيماءات بسيطة. يمكنك الإشارة إلى الوعاء أو رسم مسار على الشاشة، أو ببساطة دفع ذراع الروبوت برفق في الاتجاه الصحيح.

بخلاف طرق تعديل سلوك الروبوت الأخرى، لا تتطلب هذه التقنية من المستخدمين جمع بيانات جديدة وإعادة تدريب نموذج التعلم الآلي الذي يتحكم بالروبوت. بل تسمح للروبوت باستخدام ردود فعل بشرية فورية وبديهية لاختيار تسلسل الإجراءات الذي يتوافق بشكل أفضل مع نوايا المستخدم.

عندما اختبر الباحثون هذا الإطار المنهجي، كان معدل نجاحه أعلى بنسبة 21٪ من طريقة بديلة لم تستخدم التدخل البشري.

في المستقبل، قد يسهل إطار المنهجية هذا على المستخدمين توجيه روبوت مدرب في المصنع لأداء مهام منزلية متنوعة، حتى لو لم يرَ الروبوت البيئة أو الأشياء الموجودة في ذلك المنزل من قبل.

"لا يمكننا أن نتوقع من المستخدم العادي جمع البيانات يدويًا وضبط نموذج الشبكة العصبية بدقة. سيتوقع أن يعمل الروبوت فورًا بعد إخراجه من العلبة، وإذا حدث خطأ ما، فسيحتاج إلى آلية سهلة الاستخدام لتصحيحه. هذا هو التحدي الذي تناولناه في هذا البحث"، كما قال فيليكس يانوي وانغ، طالب الدراسات العليا في الهندسة الكهربائية وعلوم الحاسوب في معهد ماساتشوستس للتكنولوجيا والمؤلف الرئيسي للدراسة.

تقليل الانحرافات

استخدم الباحثون مؤخراً نماذج الذكاء الاصطناعي التوليدية المدربة مسبقاً لتعلم "سياسة" - وهي مجموعة من القواعد التي تتبعها الروبوتات لإنجاز مهمة ما. ويمكن لهذه النماذج حل العديد من المهام المعقدة.

أثناء التدريب، لا يتعرض النموذج إلا لحركات الروبوت الصحيحة، لذلك يتعلم إنشاء مسارات مناسبة.

مع ذلك، لا يعني هذا أن كل فعل يقوم به الروبوت سيتوافق مع رغبات المستخدم في الواقع. على سبيل المثال، قد يُدرَّب الروبوت على جلب الصناديق من الرف دون إسقاطها، ولكنه قد يفشل في الوصول إلى صندوق على رف كتب شخص ما إذا كان ترتيب الرف مختلفًا عما رآه أثناء التدريب.

للتغلب على مثل هذه الأخطاء، يقوم المهندسون عادةً بجمع المزيد من البيانات حول المهمة الجديدة وإعادة تدريب النموذج، وهي عملية مكلفة وتستغرق وقتاً طويلاً وتتطلب خبرة في مجال التعلم الآلي.

بدلاً من ذلك، يريد فريق البحث في معهد ماساتشوستس للتكنولوجيا السماح للمستخدمين بتعديل سلوك الروبوت بمجرد ارتكابه خطأً.

مع ذلك، إذا تدخل البشر في عملية اتخاذ القرار لدى الروبوت، فقد يتسبب ذلك دون قصد في اختيار النموذج التوليدي لفعل غير صحيح. قد يُحضر الروبوت الصندوق الذي يريده المستخدم، لكنه قد يُسقط الكتب على الرف أثناء ذلك.

"نريد أن يتفاعل المستخدمون مع الروبوت دون ارتكاب مثل هذه الأخطاء، وبالتالي تحقيق سلوك أكثر اتساقًا مع نية المستخدم، مع ضمان الصلاحية والجدوى في نفس الوقت"، قال فيليكس يانوي وانغ.

تعزيز قدرات اتخاذ القرار

لضمان عدم تسبب هذه التفاعلات في قيام الروبوت بأفعال غير صالحة، استخدم فريق البحث عملية أخذ عينات خاصة. تساعد هذه التقنية النموذج على اختيار إجراء من بين مجموعة من الخيارات الصالحة التي تناسب هدف المستخدم على أفضل وجه.

"بدلاً من فرض إرادتنا على المستخدم، نساعد الروبوت على فهم نواياه، ونسمح لعملية أخذ العينات بالتقلب حول السلوكيات التي تعلمها"، هذا ما قاله فيليكس يانوي وانغ.

بفضل هذه الطريقة، تفوق إطار عملهم البحثي على الطرق الأخرى في تجارب المحاكاة وكذلك في الاختبارات باستخدام أذرع روبوتية فعلية في مطبخ نموذجي.

على الرغم من أن هذه الطريقة لا تنجز المهمة دائمًا على الفور، إلا أنها توفر ميزة كبيرة للمستخدمين: إذ يمكنهم إصلاح الروبوت بمجرد اكتشاف عطل، بدلاً من انتظار الروبوت لإكمال المهمة قبل إعطاء تعليمات جديدة.

علاوة على ذلك، بعد أن يدفع المستخدم الروبوت برفق عدة مرات لتوجيهه إلى التقاط الوعاء الصحيح، يستطيع الروبوت تذكر هذا الإجراء التصحيحي ودمجه في عملية تعلمه اللاحقة. ونتيجة لذلك، في اليوم التالي، يستطيع الروبوت التقاط الوعاء الصحيح دون الحاجة إلى مزيد من التعليمات.

"لكن مفتاح هذا التحسين المستمر هو وجود آلية للمستخدمين للتفاعل مع الروبوت، وهذا بالضبط ما أثبتناه في هذا البحث"، قال فيليكس يانوي وانغ.

يهدف فريق البحث مستقبلاً إلى زيادة سرعة عملية أخذ العينات مع الحفاظ على الكفاءة أو تحسينها. كما يرغبون في اختبار هذه الطريقة في بيئات جديدة لتقييم قدرة الروبوت على التكيف.

(المصدر: أخبار معهد ماساتشوستس للتكنولوجيا)