الصورة 19.jpg
فيليكس يانوي وانغ - طالب دكتوراه في الهندسة الكهربائية وعلوم الحاسوب (EECS) بمعهد ماساتشوستس للتكنولوجيا (MIT). المصدر: أخبار معهد ماساتشوستس للتكنولوجيا

تخيل روبوتًا يساعدك في غسل الأطباق. تطلب منه أن يأخذ وعاءً من الصابون من الحوض، لكن قبضته لا تلتقطه بالضبط حيث يجب.

بفضل إطار عمل جديد طوّره باحثون في معهد ماساتشوستس للتكنولوجيا (MIT) وشركة NVIDIA، يُمكنك التحكم في سلوك الروبوت بإيماءات بسيطة. يُمكنك الإشارة إلى وعاء أو رسم مسار على الشاشة، أو ببساطة تحريك ذراع الروبوت في الاتجاه الصحيح.

بخلاف الطرق الأخرى لتعديل سلوك الروبوت، لا تتطلب هذه التقنية من المستخدم جمع بيانات جديدة وإعادة تدريب نموذج التعلم الآلي الذي يتحكم بالروبوت. بل تتيح للروبوت استخدام ردود فعل بشرية بصرية آنية لاختيار تسلسل الإجراءات الأنسب لرغبة المستخدم.

عندما اختبر الباحثون هذا الإطار، كان معدل نجاحه أعلى بنسبة 21% من النهج البديل الذي لم يستخدم التدخل البشري.

في المستقبل، قد يسهل هذا الإطار على المستخدم توجيه روبوت مدرب في المصنع لأداء مهام منزلية مختلفة، حتى لو لم يسبق للروبوت رؤية البيئة أو الأشياء الموجودة في ذلك المنزل من قبل.

يقول فيليكس يانوي وانغ، طالب دراسات عليا في قسم الهندسة الكهربائية وعلوم الحاسوب (EECS) بمعهد ماساتشوستس للتكنولوجيا والمؤلف الرئيسي للدراسة: "لا يمكننا أن نتوقع من المستخدمين العاديين جمع البيانات وضبط نموذج الشبكة العصبية. إنهم يتوقعون أن يعمل الروبوت فور إخراجه من الصندوق، وإذا حدث أي خلل، فسيحتاجون إلى آلية بديهية لتصحيحه. وهذا هو التحدي الذي تناولناه في هذه الورقة البحثية".

تقليل الانحراف

استخدم الباحثون مؤخرًا نماذج ذكاء اصطناعي توليدي مُدرَّبة مسبقًا لتعلم "سياسة" - وهي مجموعة قواعد يتبعها الروبوت لإنجاز مهمة. تستطيع هذه النماذج حل العديد من المهام المعقدة.

أثناء التدريب، يتعرض النموذج فقط لحركات الروبوت الصالحة، حتى يتعلم كيفية إنشاء مسارات الحركة المناسبة.

مع ذلك، هذا لا يعني أن كل إجراء يقوم به الروبوت سيطابق توقعات المستخدم الفعلية. على سبيل المثال، قد يُدرَّب روبوت على التقاط الصناديق من على رف دون إسقاطها، ولكنه قد يفشل في الوصول إلى صندوق على رف كتب شخص ما إذا كان تصميم الرف مختلفًا عما رآه أثناء التدريب.

ولإصلاح مثل هذه الأخطاء، يقوم المهندسون في كثير من الأحيان بجمع بيانات إضافية حول المهام الجديدة وإعادة تدريب النموذج، وهي عملية مكلفة وتستغرق وقتا طويلا وتتطلب خبرة في التعلم الآلي.

وبدلاً من ذلك، يريد فريق معهد ماساتشوستس للتكنولوجيا السماح للمستخدمين بتعديل سلوك الروبوت بمجرد ارتكابه خطأً.

ومع ذلك، إذا تدخل إنسان في عملية اتخاذ الروبوت للقرار، فقد يتسبب ذلك دون قصد في اتخاذ النموذج التوليدي إجراءً غير صحيح. قد يحصل الروبوت على الصندوق الذي يريده الإنسان، ولكنه قد يُسقط الكتب على الرف أثناء ذلك.

وقال فيليكس يانوي وانج: "نريد أن يتفاعل المستخدمون مع الروبوت دون ارتكاب مثل هذه الأخطاء، وبالتالي تحقيق سلوك يتوافق بشكل أفضل مع نوايا المستخدم، مع ضمان الصلاحية والجدوى".

تعزيز القدرة على اتخاذ القرار

لضمان عدم تسبب هذه التفاعلات في اتخاذ الروبوت إجراءات غير صحيحة، يستخدم الفريق إجراءً خاصًا لأخذ العينات. تساعد هذه التقنية النموذج على اختيار الإجراء المناسب من بين مجموعة من الخيارات الصحيحة التي تُلبي أهداف المستخدم على النحو الأمثل.

"بدلاً من فرض نوايا المستخدم، فإننا نساعد الروبوت على فهم نواياه، مع ترك عملية أخذ العينات تتقلب حول السلوكيات التي تعلمها"، كما قال فيليكس يانوي وانج.

وبفضل هذا النهج، تفوق إطارهم البحثي على الطرق الأخرى في تجارب المحاكاة، وكذلك الاختبار باستخدام ذراع آلية حقيقية في مطبخ نموذجي.

على الرغم من أن هذه الطريقة لا تكمل المهمة دائمًا على الفور، إلا أنها تتمتع بميزة كبيرة للمستخدم: حيث يمكنه تصحيح الروبوت بمجرد اكتشاف خطأ، بدلاً من انتظار الروبوت لإكمال المهمة ثم إعطاء تعليمات جديدة.

بالإضافة إلى ذلك، بعد أن يقوم المستخدم بدفع الروبوت بلطف عدة مرات لتوجيهه لالتقاط الوعاء الصحيح، يمكن للروبوت أن يتذكر هذا التصحيح ويدمجه في التعلم المستقبلي، بحيث يتمكن الروبوت في اليوم التالي من التقاط الوعاء الصحيح دون الحاجة إلى التوجيه مرة أخرى.

"ولكن مفتاح هذا التحسين المستمر هو وجود آلية لتفاعل المستخدمين مع الروبوت، وهذا بالضبط ما أظهرناه في هذه الدراسة"، كما قال فيليكس يانوي وانج.

في المستقبل، يسعى الفريق إلى تسريع عملية أخذ العينات مع الحفاظ على الأداء أو تحسينه. كما يتطلعون إلى اختبار الطريقة في بيئات جديدة لتقييم قدرة الروبوت على التكيف.

(المصدر: أخبار معهد ماساتشوستس للتكنولوجيا)