新たな研究により、人間が他の人にフィードバックを与えるのと同じように、ロボットの動作をリアルタイムで調整することが可能になった。

食器洗いを手伝ってくれるロボットを想像してみてください。シンクから石鹸の入ったボウルを取ってくるように頼んでも、グリッパーが正確に掴んでくれません。
MITとNVIDIAの研究者が開発した新しい方法論フレームワークにより、シンプルなジェスチャーでロボットの動作を制御できます。ボウルを指差したり、画面にパスを描いたり、ロボットのアームを正しい方向に軽く押したりすることも可能です。
他のロボット行動修正手法とは異なり、この技術では、ユーザーが新たなデータを収集し、ロボットを制御する機械学習モデルを再学習させる必要はありません。その代わりに、ロボットはリアルタイムで直感的な人間からのフィードバックを用いて、ユーザーの意図に最も合致する行動シーケンスを選択できます。
研究者がこの方法論的枠組みをテストしたところ、その成功率は人間の介入を利用しない代替方法よりも 21% 高かった。
将来的には、この方法論のフレームワークにより、工場で訓練されたロボットが、その家の環境や物体をこれまで見たことがなくても、ユーザーがさまざまな家事タスクを実行するように誘導することが容易になる可能性があります。
「平均的なユーザーが手動でデータを収集し、ニューラルネットワークモデルを微調整することを期待することはできません。ユーザーはロボットが箱から出してすぐに動作することを期待し、エラーが発生した場合には直感的に調整できるメカニズムを必要とします。これが、この研究で取り組んだ課題です」と、MIT電気工学・コンピュータサイエンス(EECS)の大学院生で、本研究の筆頭著者であるフェリックス・ヤンウェイ・ワン氏は述べています。
逸脱を最小限に抑える
最近、研究者たちは事前学習済みの生成AIモデルを用いて「ポリシー」(ロボットがタスクを完了するために従う一連のルール)を学習しています。これらのモデルは多くの複雑なタスクを解決できます。
トレーニング中、モデルは有効なロボットの動きにのみさらされるため、適切な軌道を作成することを学習します。
しかし、これはロボットのあらゆる行動が現実世界でユーザーの希望と一致することを意味するわけではありません。例えば、ロボットは棚から箱を倒さずに取り出すように訓練されているかもしれませんが、本棚の配置が訓練時に見たものと異なる場合、本棚にある箱に届かない可能性があります。
このようなエラーを克服するために、エンジニアは通常、新しいタスクに関するデータをさらに収集し、モデルを再トレーニングしますが、これは機械学習の専門知識を必要とする、コストと時間のかかるプロセスです。
その代わりに、MIT の研究チームは、ロボットがミスをしたらすぐにユーザーがロボットの行動を調整できるようにしたいと考えています。
しかし、人間がロボットの意思決定プロセスに介入すると、生成モデルが意図せず無効な行動を選択してしまう可能性があります。ロボットはユーザーが求めている箱を取り出すかもしれませんが、その過程で棚の本を倒してしまう可能性があります。
「私たちは、ユーザーがそのような間違いをすることなくロボットと対話し、妥当性と実現可能性を確保しながら、ユーザーの意図とより一致する動作を実現できるようにしたいと考えています」とフェリックス・ヤンウェイ・ワン氏は述べた。
意思決定能力を強化する
これらのインタラクションによってロボットが無効なアクションを実行しないようにするため、研究チームは特別なサンプリングプロセスを使用しました。この手法により、モデルは有効な選択肢の中から、ユーザーの目的に最も適したアクションを選択することができます。
「ユーザーに私たちの意志を押し付けるのではなく、ロボットがユーザーの意図を理解できるようにし、学習した行動に基づいてサンプリングのプロセスを変動させます」とフェリックス・ヤンウェイ・ワン氏は語った。
この方法のおかげで、彼らの研究フレームワークは、シミュレーション実験だけでなく、モデルキッチンでの実際のロボットアームのテストでも他の方法よりも優れた結果を出しました。
この方法では必ずしもタスクがすぐに完了するとは限りませんが、ユーザーにとって大きな利点があります。つまり、ロボットがタスクを完了するまで待ってから新しい指示を出すのではなく、障害を検出するとすぐにロボットを修復できるのです。
さらに、ユーザーがロボットを数回優しく押して正しいボウルを拾うように誘導すると、ロボットはその修正動作を記憶し、将来の学習プロセスに組み込むことができます。その結果、翌日にはロボットは追加の指示なしに正しいボウルを拾うことができるようになります。
「しかし、この継続的な改善の鍵となるのは、ユーザーがロボットと対話できる仕組みを持つことです。そして、まさにそれが今回の研究で実証されたことです」とフェリックス・ヤンウェイ・ワン氏は語った。
研究チームは今後、効率性を維持または向上させながら、サンプリングプロセスの速度向上を目指しています。また、この手法を新たな環境でテストし、ロボットの適応性を評価することも計画しています。
(出典:MITニュース)
[広告2]
出典: https://vietnamnet.vn/ung-dung-ai-tao-sinh-giup-robot-tuong-tac-thong-minh-hon-2381531.html






コメント (0)