Noi cercetări permit oamenilor să ajusteze acțiunile roboților în timp real, similar modului în care ar oferi feedback unei alte persoane.

Imaginează-ți un robot care te ajută să speli vasele. Îi ceri să ia un bol cu săpun din chiuvetă, dar cleștii nu îl prind exact unde este nevoie.
Cu un nou cadru metodologic dezvoltat de cercetătorii de la MIT și NVIDIA, puteți controla comportamentul robotului cu gesturi simple. Puteți indica spre bol sau desena o cale pe ecran sau pur și simplu puteți împinge ușor brațul robotului în direcția corectă.
Spre deosebire de alte metode de modificare a comportamentului roboților, această tehnică nu necesită ca utilizatorii să colecteze date noi și să reantreneze modelul de învățare automată care controlează robotul. În schimb, permite robotului să utilizeze feedback uman intuitiv, în timp real, pentru a selecta secvența de acțiuni care se aliniază cel mai bine cu intențiile utilizatorului.
Când cercetătorii au testat acest cadru metodologic, rata sa de succes a fost cu 21% mai mare decât cea a unei metode alternative care nu a utilizat intervenția umană.
În viitor, acest cadru metodologic ar putea facilita ghidarea de către utilizatori a unui robot antrenat în fabrică pentru a îndeplini diverse sarcini casnice, chiar dacă robotul nu a mai văzut niciodată mediul sau obiectele din casa respectivă.
„Nu ne putem aștepta ca utilizatorul obișnuit să colecteze manual date și să ajusteze fin un model de rețea neuronală. Se vor aștepta ca robotul să funcționeze imediat ce apare o eroare, iar dacă apare o eroare, vor avea nevoie de un mecanism intuitiv pentru a-l ajusta. Aceasta este provocarea pe care am abordat-o în această cercetare”, a declarat Felix Yanwei Wang, student la masterat în Inginerie Electrică și Informatică (EECS) la MIT și autor principal al studiului.
Minimizează abaterile
Recent, cercetătorii au folosit modele de inteligență artificială generativă pre-antrenate pentru a învăța o „politică” - un set de reguli pe care roboții le urmează pentru a finaliza o sarcină. Aceste modele pot rezolva multe sarcini complexe.
În timpul antrenamentului, modelul este expus doar mișcărilor valide ale robotului, astfel încât învață să creeze traiectorii adecvate.
Totuși, acest lucru nu înseamnă că fiecare acțiune a robotului se va alinia cu dorințele utilizatorului în realitate. De exemplu, un robot ar putea fi antrenat să ridice cutii de pe un raft fără a le răsturna, dar ar putea să nu ajungă la o cutie de pe raftul cuiva dacă aspectul raftului este diferit de cel observat în timpul antrenamentului.
Pentru a depăși astfel de erori, inginerii adună de obicei mai multe date despre noua sarcină și reantrenează modelul, un proces costisitor și consumator de timp care necesită expertiză în învățarea automată.
În schimb, echipa de cercetare de la MIT dorește să le permită utilizatorilor să ajusteze comportamentul robotului imediat ce acesta face o greșeală.
Totuși, dacă oamenii interferează cu procesul decizional al robotului, acest lucru ar putea determina, în mod accidental, modelul generativ să aleagă o acțiune nevalidă. Robotul ar putea recupera cutia dorită de utilizator, dar ar putea răsturna cărțile de pe raft în acest proces.
„Dorim ca utilizatorii să interacționeze cu robotul fără a face astfel de greșeli, obținând astfel un comportament mai consistent cu intenția utilizatorului, asigurând în același timp validitatea și fezabilitatea”, a declarat Felix Yanwei Wang.
Îmbunătățiți capacitățile decizionale
Pentru a se asigura că aceste interacțiuni nu determină robotul să efectueze acțiuni nevalide, echipa de cercetare a folosit un proces special de eșantionare. Această tehnică ajută modelul să selecteze o acțiune dintr-un set de opțiuni valide care se potrivește cel mai bine obiectivului utilizatorului.
„În loc să ne impunem voința asupra utilizatorului, ajutăm robotul să își înțeleagă intențiile și permitem procesului de eșantionare să fluctueze în funcție de comportamentele pe care le-a învățat”, a spus Felix Yanwei Wang.
Datorită acestei metode, cadrul lor de cercetare a depășit alte metode în experimentele de simulare, precum și în testarea cu brațe robotice reale într-o bucătărie model.
Deși această metodă nu finalizează întotdeauna sarcina imediat, oferă un avantaj semnificativ utilizatorilor: aceștia pot repara robotul imediat ce detectează o defecțiune, în loc să aștepte ca robotul să finalizeze sarcina înainte de a da noi instrucțiuni.
În plus, după ce utilizatorul împinge ușor robotul de câteva ori pentru a-l ghida să ridice bolul corect, robotul își poate aminti acea acțiune corectivă și o poate integra în procesul său viitor de învățare. Drept urmare, a doua zi, robotul poate ridica bolul corect fără a fi nevoie de instrucțiuni suplimentare.
„Însă cheia acestei îmbunătățiri continue este existența unui mecanism prin care utilizatorii să interacționeze cu robotul, iar exact asta am demonstrat în această cercetare”, a declarat Felix Yanwei Wang.
În viitor, echipa de cercetare își propune să crească viteza procesului de eșantionare, menținând sau îmbunătățind în același timp eficiența. De asemenea, doresc să testeze această metodă în medii noi pentru a evalua adaptabilitatea robotului.
(Sursa: MIT News)
Sursă: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






Comentariu (0)