الباحثون يبتكرون روبوتًا يبتسم

التحديث: 26 مايو 2021
الباحثون يبتكرون روبوتًا يبتسم

بينما تلعب تعابير وجهنا دورًا كبيرًا في بناء الثقة ، فإن معظم الروبوتات لا تزال تتمتع بالرؤية الفارغة والثابتة للاعب البوكر المحترف. مع الاستخدام المتزايد للروبوتات في المواقع التي تحتاج فيها الروبوتات والبشر إلى العمل معًا بشكل وثيق ، من دور رعاية المسنين إلى المستودعات والمصانع ، أصبحت الحاجة إلى روبوت أكثر استجابة وواقعية للوجه أكثر إلحاحًا.

منذ فترة طويلة مهتمًا بالتفاعلات بين الروبوتات والبشر ، عمل الباحثون في مختبر الآلات الإبداعية في كولومبيا للهندسة لمدة خمس سنوات على إنشاء EVA ، وهو روبوت جديد مستقل ذو وجه ناعم ومعبّر يستجيب لتتناسب مع تعبيرات البشر القريبين. سيتم تقديم البحث في مؤتمر ICRA في 30 مايو 2021 ، ومخططات الروبوت مفتوحة المصدر على Hardware-X (أبريل 2021).

قال هود ليبسون ، أستاذ جيمس وسالي سكابا للابتكار (ميكانيكي الهندسة) ومدير معمل الآلات الإبداعية.

لاحظ ليبسون اتجاهًا مشابهًا في محل البقالة ، حيث واجه إعادة تخزين الروبوتات التي تحمل شارات الأسماء ، وفي إحدى الحالات ، كان يرتدي غطاءً مريحًا ومحبوكًا يدويًا. قال: "يبدو أن الناس يقومون بإضفاء الطابع الإنساني على زملائهم الآليين من خلال إعطائهم عيونًا أو هوية أو اسمًا". "هذا جعلنا نتساءل ، إذا كانت العيون والملابس تعمل ، فلماذا لا نصنع إنسانًا آليًا له وجه بشري فائق التعبير والاستجابة؟"

في حين أن هذا يبدو بسيطًا ، إلا أن إنشاء وجه آلي مقنع كان تحديًا هائلاً لعلماء الروبوتات. لعقود من الزمان ، كانت أجزاء الجسم الروبوتية مصنوعة من المعدن أو البلاستيك الصلب ، وهي مواد كانت شديدة الصلابة بحيث لا تسمح بالتدفق والتحرك بالطريقة التي تعمل بها الأنسجة البشرية. وبالمثل ، كانت الأجهزة الروبوتية بدائية ويصعب العمل معها - فالدارات ، وأجهزة الاستشعار ، والمحركات ثقيلة ، وتستهلك طاقة كبيرة ، وضخمة.

بدأت المرحلة الأولى من المشروع في مختبر ليبسون منذ عدة سنوات عندما قاد الطالب الجامعي زانوار فرج فريقًا من الطلاب في بناء "الآلات" المادية للروبوت. قاموا ببناء EVA كتمثال نصفي غير متجسد يحمل تشابهًا قويًا مع فناني الأداء الصامت والوجهين لمجموعة Blue Man Group. يمكن أن تعبر EVA عن المشاعر الستة الأساسية للغضب ، والاشمئزاز ، والخوف ، والفرح ، والحزن ، والمفاجأة ، بالإضافة إلى مجموعة من المشاعر الأكثر دقة ، باستخدام "عضلات" اصطناعية (مثل الكابلات والمحركات) التي تسحب نقاطًا محددة في EVA الوجه ، يحاكي حركات أكثر من 42 عضلة صغيرة مرتبطة في نقاط مختلفة بجلد وعظام وجوه الإنسان.

وأشار فرج إلى أن "التحدي الأكبر في إنشاء EVA كان تصميم نظام مضغوط بما يكفي ليلائم حدود جمجمة بشرية بينما لا يزال يعمل بما يكفي لإنتاج مجموعة واسعة من تعابير الوجه".

للتغلب على هذا التحدي ، اعتمد الفريق بشكل كبير على الطباعة ثلاثية الأبعاد لتصنيع أجزاء ذات أشكال معقدة تتكامل بسلاسة وكفاءة مع جمجمة EVA. بعد أسابيع من سحب الكابلات لجعل EVA تبتسم أو تتجهم أو تبدو منزعجة ، لاحظ الفريق أن وجه إيفا الأزرق غير المتجسد يمكن أن يثير ردود فعل عاطفية من زملائهم في المختبر. يتذكر ليبسون: "كنت أفكر في عملي الخاص يومًا ما عندما أعطتني إيفا فجأة ابتسامة كبيرة وودية". "كنت أعلم أنها كانت ميكانيكية بحتة ، لكنني وجدت نفسي أبتسم بشكل انعكاسي."

بمجرد أن كان الفريق راضياً عن "ميكانيكا" EVA ، بدأوا في معالجة المرحلة الرئيسية الثانية من المشروع: برمجة الذكاء الاصطناعي الذي من شأنه أن يوجه حركات وجه EVA. بينما تم استخدام الروبوتات المتحركة النابضة بالحياة في الحدائق الترفيهية واستوديوهات الأفلام لسنوات ، حقق فريق Lipson تقدمين تقنيين. تستخدم EVA الذكاء الاصطناعي للتعلم العميق "للقراءة" ثم عكس التعبيرات على الوجوه البشرية القريبة. وقدرة EVA على محاكاة مجموعة واسعة من تعابير الوجه البشرية المختلفة يتم تعلمها عن طريق التجربة والخطأ من مشاهدة مقاطع الفيديو الخاصة بها.

تتضمن أصعب الأنشطة البشرية لأتمتة حركات جسدية غير متكررة تحدث في أماكن اجتماعية معقدة. Boyuan Chen ، دكتوراه ليبسون. سرعان ما أدرك الطالب الذي قاد مرحلة البرنامج في المشروع أن حركات وجه EVA معقدة للغاية بحيث لا يمكن التحكم فيها من خلال مجموعات محددة مسبقًا من القواعد. لمواجهة هذا التحدي ، أنشأ تشين والفريق الثاني من الطلاب دماغ EVA باستخدام العديد من الشبكات العصبية للتعلم العميق. يحتاج دماغ الروبوت إلى إتقان قدرات: أولاً ، تعلم استخدام نظامه المعقد للعضلات الميكانيكية لتوليد أي تعبير معين للوجه ، وثانيًا ، معرفة الوجوه التي يجب تكوينها من خلال "قراءة" وجوه البشر.

لتعليم EVA كيف يبدو شكل وجهها ، صور Chen والفريق ساعات من لقطات EVA وهي تصنع سلسلة من الوجوه العشوائية. بعد ذلك ، مثل الإنسان الذي يشاهد نفسه على Zoom ، تعلمت الشبكات العصبية الداخلية لإيفا أن تقرن حركة العضلات مع لقطات الفيديو لوجهها. الآن بعد أن أصبح لدى EVA إحساس بدائي بكيفية عمل وجهها (المعروفة باسم "الصورة الذاتية") ، استخدمت شبكة ثانية لمطابقة صورتها الذاتية مع صورة وجه بشري تم التقاطها على كاميرا الفيديو الخاصة بها. بعد العديد من التحسينات والتكرارات ، اكتسبت EVA القدرة على قراءة إيماءات الوجه البشري من الكاميرا والاستجابة من خلال عكس تعبير وجه ذلك الإنسان.

لاحظ الباحثون أن EVA هي تجربة معملية ، وأن المحاكاة وحدها لا تزال بعيدة كل البعد عن الطرق المعقدة التي يتواصل بها البشر باستخدام تعابير الوجه. لكن مثل هذه التقنيات التمكينية يمكن أن يكون لها في يوم من الأيام تطبيقات مفيدة في العالم الحقيقي. على سبيل المثال ، الروبوتات القادرة على الاستجابة لمجموعة متنوعة من لغة الجسد البشرية ستكون مفيدة في أماكن العمل والمستشفيات والمدارس والمنازل.

قال ليبسون: "هناك حد لمدى تفاعلنا نحن البشر عاطفياً مع برامج الدردشة المستندة إلى السحابة أو مكبرات الصوت المنزلية الذكية غير المجسدة". "يبدو أن أدمغتنا تستجيب بشكل جيد للروبوتات التي لديها نوع من الوجود المادي المميز."

وأضاف تشين ، "تتشابك الروبوتات في حياتنا بعدد متزايد من الطرق ، وبالتالي بناء الثقة بين البشر و آلات أهمية متزايدة ".