Egy új kutatás lehetővé teszi az emberek számára, hogy valós időben módosítsák a robotok műveleteit, hasonlóan ahhoz, ahogyan visszajelzést adnának egy másik személynek.

Képzelj el egy robotot, ami segít neked mosogatni. Megkéred, hogy hozzon ki egy tál szappant a mosogatóból, de a fogói nem pontosan ott fogják meg, ahol kellene.
Az MIT és az NVIDIA kutatói által kifejlesztett új módszertani keretrendszerrel egyszerű gesztusokkal vezérelhető a robot viselkedése. Rámutathatunk a tálra, rajzolhatunk egy útvonalat a képernyőn, vagy egyszerűen csak finoman eltolhatjuk a robot karját a megfelelő irányba.
Más robot viselkedésmódosító módszerekkel ellentétben ez a technika nem igényli a felhasználóktól új adatok gyűjtését és a robotot vezérlő gépi tanulási modell újratanítását. Ehelyett lehetővé teszi a robot számára, hogy valós idejű, intuitív emberi visszajelzések alapján válassza ki a felhasználó szándékaival leginkább összhangban lévő cselekvési sorrendet.
Amikor a kutatók tesztelték ezt a módszertani keretrendszert, a sikerességi aránya 21%-kal magasabb volt, mint egy alternatív, emberi beavatkozást nem igénylő módszeré.
A jövőben ez a módszertani keretrendszer megkönnyítheti a felhasználók számára, hogy egy gyárban betanított robotot vezessenek különféle háztartási feladatok elvégzésére, még akkor is, ha a robot korábban soha nem látta a környezetet vagy a tárgyakat az adott házban.
„Nem várhatjuk el az átlagfelhasználótól, hogy manuálisan gyűjtsön adatokat és finomhangoljon egy neurális hálózati modellt. Azt várják el, hogy a robot azonnal, a dobozból kivéve működjön, és ha hiba történik, akkor egy intuitív mechanizmusra van szükségük a beállításához. Ezzel a kihívással foglalkoztunk ebben a kutatásban” – mondta Felix Yanwei Wang, az MIT villamosmérnöki és számítástechnikai (EECS) szakos hallgatója és a tanulmány vezető szerzője.
Eltérések minimalizálása
A kutatók a közelmúltban előre betanított generatív mesterséges intelligencia modelleket használtak egy „szabályzat” – egy olyan szabályrendszer – megtanulására, amelyet a robotok követnek egy feladat elvégzéséhez. Ezek a modellek számos összetett feladatot képesek megoldani.
A betanítás során a modell csak érvényes robotmozgásoknak van kitéve, így megtanulja a megfelelő pályák létrehozását.
Ez azonban nem jelenti azt, hogy a robot minden egyes mozdulata a valóságban a felhasználó kívánságaival összhangban lesz. Például egy robot betanítható arra, hogy dobozokat vegyen le egy polcról anélkül, hogy felborítaná azokat, de előfordulhat, hogy nem éri el egy dobozt valakinek a könyvespolcán, ha a könyvespolc elrendezése eltér attól, amit a betanítás során látott.
Az ilyen hibák kiküszöbölése érdekében a mérnökök jellemzően több adatot gyűjtenek az új feladatról, és újratanítják a modellt, ami költséges és időigényes folyamat, és gépi tanulási szakértelmet igényel.
Ehelyett az MIT kutatócsoportja lehetővé szeretné tenni a felhasználók számára, hogy a robot viselkedését azonnal módosítsák, amint az hibázik.
Ha azonban az emberek beavatkoznak a robot döntéshozatali folyamatába, az akaratlanul is érvénytelen műveletet eredményezhet a generatív modellben. A robot ugyan visszaszerezheti a felhasználó által kívánt dobozt, de eközben felboríthatja a polcon lévő könyveket.
„Azt szeretnénk, hogy a felhasználók ilyen hibák elkövetése nélkül lépjenek interakcióba a robottal, ezáltal olyan viselkedést érve el, amely jobban összhangban van a felhasználói szándékkal, miközben továbbra is biztosítja az érvényességet és a megvalósíthatóságot” – mondta Felix Yanwei Wang.
A döntéshozatali képességek javítása
Annak érdekében, hogy ezek az interakciók ne okozzák a robot érvénytelen műveleteket, a kutatócsoport speciális mintavételi eljárást alkalmazott. Ez a technika segít a modellnek kiválasztani egy olyan műveletet az érvényes lehetőségek közül, amely a legjobban megfelel a felhasználó céljának.
„Ahelyett, hogy ráerőltetnénk akaratunkat a felhasználóra, segítünk a robotnak megérteni a szándékait, és lehetővé tesszük, hogy a mintavételi folyamat a tanult viselkedések körül ingadozzon” – mondta Felix Yanwei Wang.
Ennek a módszernek köszönhetően kutatási keretrendszerük felülmúlta a többi módszert a szimulációs kísérletekben, valamint a modellkonyhában végzett valódi robotkarokkal végzett tesztelésben.
Bár ez a módszer nem mindig végzi el azonnal a feladatot, jelentős előnyt kínál a felhasználóknak: amint hibát észlelnek, azonnal megjavíthatják a robotot, ahelyett, hogy új utasítások adásával megvárnák, amíg a robot elvégzi a feladatot.
Továbbá, miután a felhasználó néhányszor finoman meglökte a robotot, hogy az a megfelelő tálat vegye fel, a robot megjegyezheti ezt a korrekciós műveletet, és beépítheti a jövőbeli tanulási folyamatába. Ennek eredményeként másnap a robot további utasítások nélkül is fel tudja venni a megfelelő tálat.
„De ennek a folyamatos fejlesztésnek a kulcsa egy olyan mechanizmus, amellyel a felhasználók interakcióba léphetnek a robottal, és pontosan ezt mutattuk be ebben a kutatásban” – mondta Felix Yanwei Wang.
A kutatócsoport a jövőben a mintavételi folyamat sebességének növelését célozza a hatékonyság fenntartása vagy javítása mellett. Emellett új környezetekben is tesztelni szeretnék ezt a módszert, hogy felmérjék a robot alkalmazkodóképességét.
(Forrás: MIT Hírek)
[hirdetés_2]
Forrás: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






Hozzászólás (0)