Penyelidikan baharu membolehkan manusia melaraskan tindakan robot dalam masa nyata, sama seperti cara mereka memberi maklum balas kepada orang lain.

Bayangkan sebuah robot membantu anda membasuh pinggan mangkuk. Anda memintanya untuk mengambil semangkuk sabun dari sinki, tetapi pemegangnya tidak dapat memegangnya dengan tepat di tempat yang diperlukan.
Dengan rangka kerja metodologi baharu yang dibangunkan oleh penyelidik di MIT dan NVIDIA, anda boleh mengawal tingkah laku robot dengan gerak isyarat mudah. Anda boleh menunjuk ke arah mangkuk atau melukis laluan pada skrin, atau hanya menolak lengan robot dengan lembut ke arah yang betul.
Tidak seperti kaedah pengubahsuaian tingkah laku robot yang lain, teknik ini tidak memerlukan pengguna untuk mengumpul data baharu dan melatih semula model pembelajaran mesin yang mengawal robot. Sebaliknya, ia membolehkan robot menggunakan maklum balas manusia yang intuitif dan masa nyata untuk memilih urutan tindakan yang paling sejajar dengan niat pengguna.
Apabila penyelidik menguji rangka kerja metodologi ini, kadar kejayaannya adalah 21% lebih tinggi daripada kaedah alternatif yang tidak menggunakan intervensi manusia.
Pada masa hadapan, rangka kerja metodologi ini dapat memudahkan pengguna membimbing robot yang dilatih di kilang untuk melaksanakan pelbagai tugas rumah, walaupun robot tersebut tidak pernah melihat persekitaran atau objek di rumah tersebut sebelum ini.
"Kita tidak boleh mengharapkan pengguna biasa mengumpul data secara manual dan memperhalusi model rangkaian saraf. Mereka menjangkakan robot itu berfungsi terus dari awal, dan jika berlaku ralat, mereka memerlukan mekanisme intuitif untuk menyesuaikannya. Inilah cabaran yang kami tangani dalam penyelidikan ini," kata Felix Yanwei Wang, seorang pelajar siswazah dalam Kejuruteraan Elektrik dan Sains Komputer (EECS) di MIT dan penulis utama kajian ini.
Minimumkan penyimpangan
Baru-baru ini, para penyelidik telah menggunakan model AI generatif pra-latihan untuk mempelajari "dasar"—satu set peraturan yang dipatuhi oleh robot untuk menyelesaikan sesuatu tugas. Model-model ini boleh menyelesaikan banyak tugas yang kompleks.
Semasa latihan, model hanya didedahkan kepada pergerakan robot yang sah, jadi ia belajar untuk mencipta trajektori yang sesuai.
Walau bagaimanapun, ini tidak bermakna setiap tindakan robot akan selaras dengan kehendak pengguna dalam realiti. Contohnya, robot mungkin dilatih untuk mengambil kotak dari rak tanpa menjatuhkannya, tetapi mungkin gagal mencapai kotak di rak buku seseorang jika susun atur rak buku berbeza daripada apa yang dilihatnya semasa latihan.
Untuk mengatasi ralat tersebut, jurutera biasanya mengumpulkan lebih banyak data mengenai tugas baharu dan melatih semula model tersebut, satu proses yang mahal dan memakan masa yang memerlukan kepakaran dalam pembelajaran mesin.
Sebaliknya, pasukan penyelidikan di MIT mahu membenarkan pengguna melaraskan tingkah laku robot sebaik sahaja ia membuat kesilapan.
Walau bagaimanapun, jika manusia mengganggu proses membuat keputusan robot, ia secara tidak sengaja boleh menyebabkan model generatif memilih tindakan yang tidak sah. Robot mungkin mengambil kotak yang dikehendaki pengguna, tetapi boleh menjatuhkan buku di rak dalam proses tersebut.
"Kami mahu pengguna berinteraksi dengan robot tanpa melakukan kesilapan sedemikian, sekali gus mencapai tingkah laku yang lebih konsisten dengan niat pengguna, sambil memastikan kesahan dan kebolehlaksanaan," kata Felix Yanwei Wang.
Meningkatkan keupayaan membuat keputusan
Bagi memastikan interaksi ini tidak menyebabkan robot melakukan tindakan yang tidak sah, pasukan penyelidikan telah menggunakan proses persampelan khas. Teknik ini membantu model memilih tindakan daripada satu set pilihan yang sah yang paling sesuai dengan matlamat pengguna.
"Daripada memaksakan kehendak kita kepada pengguna, kita membantu robot memahami niat mereka, dan membenarkan proses persampelan berubah-ubah mengikut tingkah laku yang telah dipelajarinya," kata Felix Yanwei Wang.
Hasil daripada kaedah ini, rangka kerja penyelidikan mereka mengatasi kaedah lain dalam eksperimen simulasi serta ujian dengan lengan robot sebenar di dapur model.
Walaupun kaedah ini tidak selalunya menyelesaikan tugas dengan segera, ia menawarkan kelebihan yang ketara kepada pengguna: mereka boleh membaiki robot sebaik sahaja mereka mengesan kerosakan, dan bukannya menunggu robot menyelesaikan tugas sebelum memberikan arahan baharu.
Tambahan pula, selepas pengguna menolak robot dengan lembut beberapa kali untuk membimbingnya mengambil mangkuk yang betul, robot tersebut boleh mengingati tindakan pembetulan tersebut dan mengintegrasikannya ke dalam proses pembelajarannya pada masa hadapan. Hasilnya, pada keesokan harinya, robot tersebut boleh mengambil mangkuk yang betul tanpa memerlukan arahan lanjut.
"Tetapi kunci kepada penambahbaikan berterusan ini adalah mempunyai mekanisme untuk pengguna berinteraksi dengan robot, dan itulah yang telah kami tunjukkan dalam kajian ini," kata Felix Yanwei Wang.
Pada masa hadapan, pasukan penyelidikan menyasarkan untuk meningkatkan kelajuan proses persampelan sambil mengekalkan atau menambah baik kecekapan. Mereka juga ingin menguji kaedah ini dalam persekitaran baharu untuk menilai kebolehsuaian robot.
(Sumber: Berita MIT)
[iklan_2]
Sumber: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






Komen (0)