استخدام التعلم المعزز من محاكاة إلى حقيقية لتدريب الروبوتات على القيام بمهام بسيطة في بيئات واسعة

التحديث: 19 أبريل 2024


استخدام التعلم المعزز من محاكاة إلى حقيقية لتدريب الروبوتات على القيام بمهام بسيطة في بيئات واسعة
النشر إلى البيئات الخارجية. الائتمان: إيليا رادوسافوف

أفاد فريق من علماء الروبوتات في جامعة كاليفورنيا، بيركلي، أنه من الممكن تدريب الروبوتات على القيام بمهام بسيطة نسبيًا باستخدام التعلم المعزز من محاكاة الواقع لتدريبهم. وفي دراستهم التي نشرت في المجلة الروبوتات العلمقامت المجموعة بتدريب الروبوت على المشي في بيئات غير مألوفة بينما كان يحمل أحمالًا مختلفة، وكل ذلك دون أن ينقلب.

على مدى السنوات القليلة الماضية، استخدم علماء الروبوتات مجموعة متنوعة من التقنيات لتدريب الروبوتات على التحرك بكفاءة وسرعة عبر بيئات متنوعة. ولكن كما لاحظ الباحثون في هذا الجهد الجديد، فإن مثل هذه الروبوتات ليس لديها الكثير من التطبيقات المفيدة. ويشيرون إلى أن الروبوتات القادرة على تنفيذ المهام الدنيوية بطريقة بطيئة ولكن فعالة ستكون أكثر فائدة بكثير. ولتحقيق هذه الغاية، لجأوا إلى التعلم المعزز من المحاكاة إلى الواقع.






النشر في البيئات الخارجية. الائتمان: إيليا رادوسافوف

تتضمن هذه التقنية تدريب نسخة محاكاة للروبوت لتنفيذ المهام المطلوبة من خلال تعريضه لمليارات الأمثلة في بيئات محاكاة. تتضمن الطريقة أيضًا استخدام نظام المكافأة/العقوبة كجزء من تدريب الروبوت - إذا فعل شيئًا صحيحًا أثناء محاولته تحقيق هدف ما، فسيتم مكافأته بالحصول على "1" على سبيل المثال. ومع ذلك، إذا ارتكبت خطأ ما، فإنها تتلقى "-1". مع مرور الوقت، يقوم بتحسين أدائه حيث يسعى إلى زيادة عدد المكافآت الخاصة به.

استخدم فريق البحث هذا النهج لتدريب روبوت يُدعى Digit على التنقل في مسار على طول الرصيف في جزء غير معروف من المدينة والتعافي بعد تعرضه لهجوم متكرر بواسطة كرة كبيرة، وللتغلب على القيود الجسدية، والمشي عبر المواد التي قد تكون خطرة. التسبب في تعثرها، وحمل حقيبة ظهر، وحمل كيس قمامة إلى سلة المهملات، واستخدام حقيبة حمل لحمل الأغراض الشخصية.






التجارب الداخلية ومعيار المحاكاة. الائتمان: إيليا رادوسافوفيتش

يقترح الباحثون أنه يمكن استخدام التعلم المعزز من محاكاة الواقع لتدريب الروبوتات في بيئات العالم الحقيقي مثل المنزل أو المكتب أو أرضية المصنع. ويشيرون إلى أن الفكرة هي جعل الروبوتات أكثر فائدة.