Penyelidikan baharu membolehkan manusia melaraskan tindakan robot dalam masa nyata, sama seperti cara mereka memberi maklum balas kepada orang lain.
Bayangkan robot sedang membantu anda membasuh pinggan. Anda memintanya untuk mengambil semangkuk sabun dari sinki, tetapi pencengkamnya tidak mengambil tempat yang diperlukan.
Dengan rangka kerja baharu yang dibangunkan oleh penyelidik di MIT dan NVIDIA, anda boleh mengawal tingkah laku robot dengan gerak isyarat yang mudah. Anda boleh menunjuk ke arah mangkuk atau melukis laluan pada skrin, atau hanya menyenggol lengan robot ke arah yang betul.
Tidak seperti pendekatan lain untuk mengubah suai tingkah laku robot, teknik ini tidak memerlukan pengguna mengumpul data baharu dan melatih semula model pembelajaran mesin yang mengawal robot. Sebaliknya, ia membenarkan robot menggunakan maklum balas manusia visual masa nyata untuk memilih urutan tindakan yang paling sepadan dengan niat pengguna.
Apabila penyelidik menguji rangka kerja ini, kadar kejayaannya adalah 21% lebih tinggi daripada pendekatan alternatif yang tidak menggunakan campur tangan manusia.
Pada masa hadapan, rangka kerja ini boleh memudahkan pengguna untuk mengarahkan robot terlatih kilang untuk melaksanakan pelbagai tugas rumah, walaupun robot itu tidak pernah melihat persekitaran atau objek di rumah itu sebelum ini.
"Kami tidak boleh mengharapkan pengguna biasa untuk mengumpul data dan memperhalusi model rangkaian saraf. Mereka menjangkakan robot berfungsi dengan betul di luar kotak, dan jika berlaku kesilapan, mereka memerlukan mekanisme intuitif untuk membetulkannya. Inilah cabaran yang kami tangani dalam kertas kerja ini," kata Felix Yanwei Wang, pelajar siswazah di jabatan Kejuruteraan Elektrik dan Sains Komputer (EECS) di MIT dan ketua pengarang kajian.
Minimumkan penyelewengan
Baru-baru ini, penyelidik telah menggunakan model AI generatif yang telah dilatih untuk mempelajari "dasar"—satu set peraturan yang dipatuhi oleh robot untuk menyelesaikan tugas. Model ini boleh menyelesaikan banyak tugas yang kompleks.
Semasa latihan, model hanya terdedah kepada pergerakan robot yang sah, jadi ia belajar untuk menjana trajektori pergerakan yang sesuai.
Walau bagaimanapun, ini tidak bermakna bahawa setiap tindakan yang dilakukan oleh robot akan sepadan dengan jangkaan sebenar pengguna. Sebagai contoh, robot mungkin dilatih untuk mengambil kotak dari rak tanpa mengetuknya, tetapi mungkin gagal mencapai kotak pada rak buku seseorang jika susun atur rak buku berbeza daripada apa yang dilihat semasa latihan.
Untuk membetulkan ralat sedemikian, jurutera sering mengumpul data tambahan tentang tugas baharu dan melatih semula model, proses yang mahal dan memakan masa yang memerlukan kepakaran pembelajaran mesin.
Sebaliknya, pasukan MIT mahu membenarkan pengguna melaraskan tingkah laku robot sebaik sahaja ia membuat kesilapan.
Walau bagaimanapun, jika manusia mengganggu proses membuat keputusan robot, ia mungkin secara tidak sengaja menyebabkan model generatif memilih tindakan yang tidak sah. Robot mungkin mendapatkan kotak yang diingini manusia, tetapi mungkin mengetuk buku di rak dalam proses itu.
"Kami mahu pengguna berinteraksi dengan robot tanpa membuat kesilapan sedemikian, dengan itu mencapai tingkah laku yang lebih sepadan dengan niat pengguna, sambil tetap memastikan kesahihan dan kebolehlaksanaan," kata Felix Yanwei Wang.
Meningkatkan keupayaan membuat keputusan
Untuk memastikan bahawa interaksi ini tidak menyebabkan robot mengambil tindakan yang tidak sah, pasukan menggunakan prosedur pensampelan khas. Teknik ini membantu model memilih tindakan daripada satu set pilihan sah yang paling sepadan dengan matlamat pengguna.
“Daripada memaksakan niat pengguna, kami membantu robot memahami niat mereka, sambil membiarkan proses pensampelan berubah-ubah mengikut tingkah laku yang telah dipelajarinya,” kata Felix Yanwei Wang.
Terima kasih kepada pendekatan ini, rangka kerja penyelidikan mereka mengatasi kaedah lain dalam eksperimen simulasi serta ujian dengan lengan robot sebenar dalam dapur model.
Walaupun kaedah ini tidak selalu menyelesaikan tugas dengan segera, ia mempunyai kelebihan besar untuk pengguna: mereka boleh membetulkan robot sebaik sahaja mereka mengesan ralat, dan bukannya menunggu robot menyelesaikan tugasan dan kemudian memberikan arahan baharu.
Selain itu, selepas pengguna menyenggol robot dengan lembut beberapa kali untuk membimbingnya mengambil mangkuk yang betul, robot boleh mengingati pembetulan itu dan memasukkannya ke dalam pembelajaran masa hadapan, jadi pada keesokan harinya robot boleh mengambil mangkuk yang betul tanpa perlu dibimbing lagi.
"Tetapi kunci kepada penambahbaikan berterusan ini adalah untuk mempunyai mekanisme untuk pengguna berinteraksi dengan robot, dan itulah yang kami tunjukkan dalam kajian ini," kata Felix Yanwei Wang.
Pada masa hadapan, pasukan itu mahu mempercepatkan proses pensampelan sambil mengekalkan atau meningkatkan prestasi. Mereka juga ingin menguji kaedah dalam persekitaran baharu untuk menilai kebolehsuaian robot.
(Sumber: MIT News)
Sumber: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html
Komen (0)