تتعلم الروبوتات الأكثر ذكاءً كيفية التكيف وإكمال المهام

يقوم باحثون من معهد ماساتشوستس للتكنولوجيا بتعليم الروبوتات التكيف باستخدام نماذج اللغة، مما يمكنهم من التعامل مع المواقف غير المتوقعة وإكمال المهام.

في هذه الصورة المجمعة، تحاول يد آلية التقاط كرات رخامية حمراء ووضعها في وعاء آخر بينما تقوم يد الباحث بتعطيلها بشكل متكرر. ينجح الروبوت في النهاية. الاعتمادات: الصورة: خوسيه لويس أوليفاريس، معهد ماساتشوستس للتكنولوجيا. اللقطات مجاملة للباحثين
في هذه الصورة المجمعة، تحاول يد آلية التقاط كرات رخامية حمراء ووضعها في وعاء آخر بينما تقوم يد الباحث بتعطيلها بشكل متكرر. ينجح الروبوت في النهاية.
الاعتمادات:الصورة: خوسيه لويس أوليفاريس، معهد ماساتشوستس للتكنولوجيا. اللقطات مجاملة للباحثين

يتم تدريب الروبوتات على أداء مهام منزلية متزايدة التعقيد، بدءًا من مسح الانسكابات وحتى تقديم الطعام، غالبًا من خلال التقليد، حيث تتم برمجتها لتقليد الحركات التي يوجهها الإنسان. في حين أن الروبوتات مقلدة ممتازة، إلا أنها قد لا تعرف كيفية التعامل مع الصدمات والدفعات غير المتوقعة إلا إذا قام المهندسون ببرمجتها على التكيف وفقًا لذلك، مما قد يؤدي إلى اضطرارهم إلى إعادة تشغيل مهامهم من البداية.

قام مهندسو معهد ماساتشوستس للتكنولوجيا (MIT) بدمج بيانات حركة الروبوت مع نماذج لغوية كبيرة (LLMs) لإعطاء الروبوتات الحس السليم في المواقف خارج المسار. يتيح ذلك للروبوتات تقسيم المهام إلى مهام فرعية والتكيف مع الاضطرابات دون إعادة التشغيل أو الحاجة إلى برمجة واضحة لكل فشل محتمل.

مهمة اللغة

أظهر الباحثون مهمة مغرفة الرخام التي تنطوي على سلسلة من المهام الفرعية مثل الوصول، والمغرفة، والصب. بدون برمجة محددة لكل مهمة فرعية، سيتعين على الروبوت الذي يتم دفعه خارج المسار إعادة التشغيل. لقد استكشفوا استخدام LLMs، التي يمكنها معالجة النص لإنشاء قوائم منطقية للمهام الفرعية، مثل "الوصول" و"المغرفة" و"الصب". يمكن لهذا النهج أن يمكّن الروبوتات من التصحيح الذاتي في الوقت الفعلي دون الحاجة إلى برمجة إضافية واسعة النطاق.

رسم خرائط الرخام

قام الفريق بتطوير خوارزمية لربط الوضع الجسدي للروبوت أو حالة الصورة مع تسمية اللغة الطبيعية للمهمة الفرعية، والمعروفة باسم "التأريض". تتعلم هذه الخوارزمية كيفية التعرف تلقائيًا على المهمة الفرعية الدلالية للروبوت، مثل "الوصول" أو "السبق الصحفي"، بناءً على إحداثياته ​​المادية أو عرض الصورة. في التجارب التي أجريت على ذراع آلية تم تدريبها على مهمة تجريف الرخام، أظهر الفريق هذا النهج من خلال توجيه الروبوت خلال المهمة واستخدام ماجستير في القانون مدرب مسبقًا لسرد الخطوات المتضمنة.

ثم سمح الفريق للروبوت بتنفيذ مهمة الجرف باستخدام مصنفات التأريض التي تم تعلمها حديثًا. ومع تقدم الروبوت، دفعه المجربون ودفعوه بعيدًا عن مساره وأسقطوا الكرات الرخامية من ملعقته. فبدلاً من التوقف والبدء من جديد أو الاستمرار دون أدنى شك، يستطيع الروبوت التصحيح الذاتي وإكمال كل مهمة فرعية قبل الانتقال إلى المهمة التالية.