sim-to-real 強化学習を使用して、幅広い環境で単純なタスクを実行できるようにロボットをトレーニングする

更新日: 19 年 2024 月 XNUMX 日


sim-to-real 強化学習を使用して、幅広い環境で単純なタスクを実行できるようにロボットをトレーニングする
屋外環境への展開。クレジット: イリヤ・ラドサヴォフ

カリフォルニア大学バークレー校のロボット工学者チームは、シミュレーションからリアルへの強化学習を使用してロボットを訓練することで、比較的単純なタスクを実行するようにロボットを訓練することが可能であると報告しています。雑誌に掲載された彼らの研究では 科学ロボット工学、研究グループは、ロボットが不慣れな環境でさまざまな荷物を運びながら、転倒することなく歩くことを訓練しました。

過去数年にわたって、ロボット工学者はさまざまな技術を使用して、さまざまな環境で効率的かつ迅速に移動できるようにロボットを訓練してきました。しかし、この新たな取り組みを行っている研究者らが指摘しているように、このようなロボットには有用な用途はそれほど多くない。彼らは、日常的な作業をゆっくりとしかし効率的に実行できるロボットの方がはるかに役立つだろうと示唆しています。この目的を達成するために、彼らはシミュレーションからリアルへの強化学習に目を向けました。






屋外環境での展開。クレジット: イリヤ・ラドサヴォフ

この技術には、シミュレートされた環境でロボットを何十億ものサンプルにさらして、ロボットのシミュレートされたバージョンをトレーニングして、目的のタスクを実行することが含まれます。この方法には、ロボットのトレーニングの一環として報酬/ペナルティ システムを使用することも含まれます。ロボットが目標を達成するために何かを正しく実行すると、たとえば「1」を受け取るなどの報酬が与えられます。ただし、何か間違ったことをした場合は「-1」が与えられます。時間の経過とともに、報酬の数を増やそうとするため、パフォーマンスが向上します。

研究チームは、このアプローチを使って、町の未知の場所にある歩道に沿って道を移動し、大きなボールで繰り返し攻撃された後に回復し、身体的拘束を克服し、危険な物質を横切って歩くように、Digitと呼ばれるロボットを訓練しました。つまずいたり、バックパックを背負ったり、ゴミの入った袋をゴミ箱に運んだり、私物を持ち歩くのにトートバッグを使用したりします。






屋内実験とシミュレーションのベンチマーク。クレジット: イリヤ・ラドサボビッチ

研究者らは、シミュレーションからリアルへの強化学習を使用して、家庭、オフィス、工場現場などの実世界の環境でロボットを訓練できる可能性があると示唆しています。彼らによれば、そのアイデアはロボットをより便利にすることだという。