Uso del aprendizaje por refuerzo de simulación a real para entrenar robots para que realicen tareas simples en entornos amplios

Actualización: 19 de abril de 2024


Uso del aprendizaje por refuerzo de simulación a real para entrenar robots para que realicen tareas simples en entornos amplios
Despliegue en entornos exteriores. Crédito: Ilija Radosavov

Un equipo de robóticos de la Universidad de California, Berkeley, informa que es posible entrenar robots para que realicen tareas relativamente simples utilizando el aprendizaje por refuerzo de simulación a real para entrenarlos. En su estudio, publicado en la revista Robótica Ciencia, el grupo entrenó a un robot para que caminara en entornos desconocidos mientras transportaba diferentes cargas, todo ello sin caerse.

En los últimos años, los expertos en robótica han utilizado una variedad de técnicas para entrenar robots para que se muevan de manera eficiente y rápida en diversos entornos. Pero como señalan los investigadores de este nuevo esfuerzo, estos robots no tienen muchas aplicaciones útiles. Sugieren que los robots que sean capaces de realizar tareas mundanas de manera lenta pero eficiente serían mucho más útiles. Para ello, han recurrido al aprendizaje por refuerzo de simulación a real.






Implementación en ambientes exteriores. Crédito: Ilija Radosavov

La técnica implica entrenar una versión simulada de un robot para que realice las tareas deseadas exponiéndolo a miles de millones de ejemplos en entornos simulados. El método también implica el uso de un sistema de recompensa/penalización como parte del entrenamiento del robot: si hace algo bien mientras intenta alcanzar una meta, es recompensado recibiendo un "1", por ejemplo. Sin embargo, si hace algo mal, recibe un "-1". Con el tiempo, mejora su rendimiento a medida que busca aumentar el número de recompensas.

El equipo de investigación utilizó este enfoque para entrenar a un robot llamado Digit para recorrer un camino a lo largo de una acera en una parte desconocida de una ciudad y recuperarse después de haber sido atacado repetidamente por una pelota grande, superar una restricción física, caminar sobre materiales que podrían hacer que se tropiece, llevar una mochila, llevar una bolsa de basura a un contenedor y usar una bolsa de mano para llevar artículos personales.






Experimentos en interiores y benchmark de simulación. Crédito: Ilija Radosavovic

Los investigadores sugieren que el aprendizaje por refuerzo de simulación a real podría utilizarse para entrenar robots en entornos del mundo real, como el hogar, la oficina o la fábrica. La idea, señalan, es hacer que los robots sean más útiles.