מחקר חדש מאפשר לבני אדם להתאים את פעולותיהם של רובוטים בזמן אמת, בדומה לאופן שבו הם היו נותנים משוב לאדם אחר.

דמיינו רובוט שעוזר לכם לשטוף כלים. אתם מבקשים ממנו להוציא קערת סבון מהכיור, אבל האחיזה שלו לא אוחזת בה בדיוק במקום הדרוש.
בעזרת מתודולוגיה חדשה שפותחה על ידי חוקרים ב-MIT וב-NVIDIA, ניתן לשלוט בהתנהגות הרובוט באמצעות מחוות פשוטות. ניתן להצביע על הקערה או לצייר נתיב על המסך, או פשוט לדחוף בעדינות את זרוע הרובוט בכיוון הנכון.
בניגוד לשיטות אחרות לשינוי התנהגות רובוטית, טכניקה זו אינה דורשת מהמשתמשים לאסוף נתונים חדשים ולאמן מחדש את מודל למידת המכונה השולט ברובוט. במקום זאת, היא מאפשרת לרובוט להשתמש במשוב אנושי אינטואיטיבי בזמן אמת כדי לבחור את רצף הפעולות המתאים ביותר לכוונות המשתמש.
כאשר חוקרים בדקו את המסגרת המתודולוגית הזו, שיעור ההצלחה שלה היה גבוה ב-21% משיטה חלופית שלא השתמשה בהתערבות אנושית.
בעתיד, מסגרת מתודולוגית זו עשויה להקל על משתמשים להדריך רובוט שאומן במפעל לבצע משימות ביתיות שונות, גם אם הרובוט מעולם לא ראה את הסביבה או החפצים באותו בית קודם לכן.
"אנחנו לא יכולים לצפות שהמשתמש הממוצע יאסוף נתונים באופן ידני ויכוון מודל של רשת נוירונים. הם יצפו שהרובוט יעבוד מיד עם השימוש, ואם מתרחשת שגיאה, הם יזדקקו למנגנון אינטואיטיבי כדי להתאים אותה. זה האתגר שטיפלנו בו במחקר זה", אמר פליקס יאנוויי וואנג, סטודנט לתואר שני בהנדסת חשמל ומדעי המחשב (EECS) ב-MIT והמחבר הראשי של המחקר.
מזער סטיות
לאחרונה, חוקרים השתמשו במודלים של בינה מלאכותית גנרטיבית שאומנו מראש כדי ללמוד "מדיניות" - קבוצת כללים שרובוטים פועלים לפיה כדי להשלים משימה. מודלים אלה יכולים לפתור משימות מורכבות רבות.
במהלך האימון, המודל נחשף רק לתנועות רובוט תקפות, ולכן הוא לומד ליצור מסלולים מתאימים.
עם זאת, אין פירוש הדבר שכל פעולה של הרובוט תתיישב עם רצונות המשתמש במציאות. לדוגמה, רובוט עשוי להיות מאומן לאסוף קופסאות ממדף מבלי להפיל אותן, אך עלול להיכשל בגישה לקופסה על מדף הספרים של מישהו אם סידור מדף הספרים שונה ממה שראה במהלך האימון.
כדי להתגבר על שגיאות כאלה, מהנדסים בדרך כלל אוספים נתונים נוספים על המשימה החדשה ומאמנים מחדש את המודל, תהליך יקר וגוזל זמן הדורש מומחיות בלמידת מכונה.
במקום זאת, צוות המחקר ב-MIT רוצה לאפשר למשתמשים להתאים את התנהגות הרובוט ברגע שהוא עושה טעות.
עם זאת, אם בני אדם מתערבים בתהליך קבלת ההחלטות של הרובוט, הדבר עלול לגרום בטעות למודל הגנרטיבי לבחור פעולה לא חוקית. הרובוט עשוי לאסוף את הקופסה שהמשתמש רוצה, אך עלול להפיל ספרים מהמדף בתהליך.
"אנחנו רוצים שמשתמשים יקיימו אינטראקציה עם הרובוט מבלי לעשות טעויות כאלה, ובכך ישיגו התנהגות שתהיה עקבית יותר עם כוונת המשתמש, תוך הבטחת תקפות וישימות", אמר פליקס יאנוויי וואנג.
שיפור יכולות קבלת החלטות
כדי להבטיח שאינטראקציות אלו לא יגרמו לרובוט לבצע פעולות לא חוקיות, צוות המחקר השתמש בתהליך דגימה מיוחד. טכניקה זו עוזרת למודל לבחור פעולה מתוך קבוצת אפשרויות תקפות המתאימה ביותר למטרה של המשתמש.
"במקום לכפות את רצוננו על המשתמש, אנו עוזרים לרובוט להבין את כוונותיו, ומאפשרים לתהליך הדגימה להשתנות סביב ההתנהגויות שהוא למד", אמר פליקס יאנוויי וואנג.
הודות לשיטה זו, מסגרת המחקר שלהם עלתה על שיטות אחרות בניסויי סימולציה וכן בבדיקות עם זרועות רובוטיות אמיתיות במטבח לדוגמה.
למרות ששיטה זו לא תמיד משלימה את המשימה באופן מיידי, היא מציעה יתרון משמעותי למשתמשים: הם יכולים לתקן את הרובוט ברגע שהם מזהים תקלה, במקום לחכות שהרובוט יסיים את המשימה לפני שיתן הוראות חדשות.
יתר על כן, לאחר שהמשתמש דוחף את הרובוט בעדינות מספר פעמים כדי להנחות אותו להרים את הקערה הנכונה, הרובוט יכול לזכור את הפעולה המתקנת הזו ולשלב אותה בתהליך הלמידה העתידי שלו. כתוצאה מכך, למחרת, הרובוט יכול להרים את הקערה הנכונה מבלי להזדקק להדרכה נוספת.
"אבל המפתח לשיפור מתמיד זה הוא קיום מנגנון שבו משתמשים יכולים לתקשר עם הרובוט, וזה בדיוק מה שהדגמנו במחקר הזה", אמר פליקס יאנוויי וואנג.
בעתיד, צוות המחקר שואף להגביר את מהירות תהליך הדגימה תוך שמירה או שיפור היעילות. הם גם רוצים לבחון שיטה זו בסביבות חדשות כדי להעריך את יכולת ההסתגלות של הרובוט.
(מקור: חדשות MIT)
[מודעה_2]
מקור: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






תגובה (0)