Các nhà nghiên cứu tạo ra robot mỉm cười trở lại

Cập nhật: 26/2021/XNUMX
Các nhà nghiên cứu tạo ra robot mỉm cười trở lại

Trong khi nét mặt của chúng ta đóng một vai trò rất lớn trong việc xây dựng lòng tin, hầu hết các robot vẫn thể hiện vẻ ngoài tĩnh lặng và trống rỗng của một người chơi poker chuyên nghiệp. Với việc sử dụng ngày càng nhiều rô bốt ở những vị trí mà rô bốt và con người cần làm việc chặt chẽ với nhau, từ viện dưỡng lão đến nhà kho và nhà máy, nhu cầu về một loại rô bốt có khuôn mặt giống thật, nhạy hơn ngày càng trở nên cấp thiết.

Từ lâu quan tâm đến sự tương tác giữa robot và con người, các nhà nghiên cứu tại Phòng thí nghiệm Máy móc Sáng tạo tại Columbia Engineering đã làm việc trong 30 năm để tạo ra EVA, một robot tự động mới với khuôn mặt mềm mại và biểu cảm, phản ứng phù hợp với biểu cảm của những người gần đó. Nghiên cứu sẽ được trình bày tại hội nghị ICRA vào ngày 2021 tháng 2021 năm XNUMX và các bản thiết kế robot có nguồn mở trên Hardware-X (tháng XNUMX năm XNUMX).

“Ý tưởng về EVA đã hình thành cách đây vài năm khi tôi và các sinh viên của tôi bắt đầu nhận thấy rằng các robot trong phòng thí nghiệm của chúng tôi đang nhìn chằm chằm vào chúng tôi qua những con mắt như nhựa,”, Hod Lipson, James và Sally Scapa Giáo sư về Sáng tạo (Cơ khí Kỹ thuật) và giám đốc Phòng thí nghiệm Máy móc Sáng tạo.

Lipson đã quan sát thấy một xu hướng tương tự trong cửa hàng tạp hóa, nơi anh bắt gặp những con rô bốt còn hàng có đeo huy hiệu tên, và trong một trường hợp, được trang trí trong một chiếc mũ đan tay ấm cúng. “Mọi người dường như đang nhân hóa các đồng nghiệp robot của họ bằng cách cho họ đôi mắt, danh tính hoặc tên,” anh nói. “Điều này khiến chúng tôi tự hỏi, nếu mắt và quần áo hoạt động, tại sao không tạo ra một robot có khuôn mặt người siêu biểu cảm và phản ứng nhanh?”

Mặc dù điều này nghe có vẻ đơn giản, nhưng việc tạo ra một khuôn mặt người máy thuyết phục lại là một thách thức ghê gớm đối với các nhà chế tạo người máy. Trong nhiều thập kỷ, các bộ phận cơ thể của robot đã được làm bằng kim loại hoặc nhựa cứng, những vật liệu quá cứng để có thể chảy và di chuyển theo cách mô của con người. Phần cứng rô bốt tương tự thô sơ và khó làm việc — các mạch, cảm biến và động cơ đều nặng, tiêu tốn nhiều điện năng và cồng kềnh.

Giai đoạn đầu tiên của dự án bắt đầu trong phòng thí nghiệm của Lipson vài năm trước khi sinh viên đại học Zanwar Faraj dẫn đầu một nhóm sinh viên trong việc chế tạo “máy móc” vật lý của robot. Họ đã xây dựng EVA như một bức tượng bán thân quái gở có nét tương đồng mạnh mẽ với những người biểu diễn hoạt hình im lặng nhưng có khuôn mặt của Nhóm Blue Man. EVA có thể thể hiện sáu cảm xúc cơ bản là tức giận, ghê tởm, sợ hãi, vui, buồn và ngạc nhiên, cũng như một loạt các cảm xúc sắc thái hơn, bằng cách sử dụng các “cơ” nhân tạo (tức là dây cáp và động cơ) để kéo các điểm cụ thể trên EVA khuôn mặt, bắt chước chuyển động của hơn 42 cơ nhỏ được gắn ở các điểm khác nhau trên da và xương của khuôn mặt người.

Faraj lưu ý: “Thách thức lớn nhất trong việc tạo ra EVA là thiết kế một hệ thống đủ nhỏ gọn để phù hợp với giới hạn của hộp sọ người trong khi vẫn đủ chức năng để tạo ra một loạt các biểu cảm trên khuôn mặt.

Để vượt qua thử thách này, nhóm nghiên cứu chủ yếu dựa vào in 3D để sản xuất các bộ phận có hình dạng phức tạp tích hợp liền mạch và hiệu quả với hộp sọ của EVA. Sau nhiều tuần kéo dây cáp để khiến EVA mỉm cười, cau mày hoặc trông buồn bã, nhóm nghiên cứu nhận thấy rằng khuôn mặt xanh xao, quái gở của EVA có thể gợi ra phản ứng cảm xúc từ các đồng nghiệp trong phòng thí nghiệm của họ. “Một ngày nọ, tôi đang bận tâm đến công việc kinh doanh của mình thì EVA đột nhiên nở một nụ cười thật tươi và thân thiện,” Lipson nhớ lại. "Tôi biết đó hoàn toàn là máy móc, nhưng theo phản xạ, tôi đã mỉm cười đáp lại."

Khi nhóm đã hài lòng với “cơ chế” của EVA, họ bắt đầu giải quyết giai đoạn chính thứ hai của dự án: Lập trình trí tuệ nhân tạo hướng dẫn các chuyển động trên khuôn mặt của EVA. Trong khi các robot hoạt hình giống như thật đã được sử dụng tại các công viên giải trí và trong các xưởng phim trong nhiều năm, nhóm của Lipson đã thực hiện hai tiến bộ công nghệ. EVA sử dụng trí tuệ nhân tạo học sâu để “đọc” và sau đó phản chiếu các biểu cảm trên khuôn mặt người gần đó. Và khả năng bắt chước một loạt các biểu hiện trên khuôn mặt người khác nhau của EVA được học bằng cách thử và sai từ việc xem video của chính nó.

Các hoạt động khó tự động nhất của con người liên quan đến các chuyển động thể chất không lặp lại diễn ra trong môi trường xã hội phức tạp. Boyuan Chen, Tiến sĩ của Lipson sinh viên dẫn đầu giai đoạn phần mềm của dự án, nhanh chóng nhận ra rằng các chuyển động trên khuôn mặt của EVA là một quá trình quá phức tạp để bị chi phối bởi các bộ quy tắc được xác định trước. Để giải quyết thách thức này, Chen và nhóm sinh viên thứ hai đã tạo ra bộ não của EVA bằng cách sử dụng một số mạng thần kinh Deep Learning. Bộ não của robot cần phải thành thạo hai khả năng: Thứ nhất, học cách sử dụng hệ thống cơ học phức tạp của chính nó để tạo ra bất kỳ biểu hiện khuôn mặt cụ thể nào, và thứ hai, biết khuôn mặt nào sẽ tạo ra bằng cách “đọc” khuôn mặt của con người.

Để dạy cho EVA biết khuôn mặt của chính nó trông như thế nào, Chen và nhóm đã quay hàng giờ đồng hồ cảnh EVA tạo ra một loạt các khuôn mặt ngẫu nhiên. Sau đó, giống như một con người đang xem chính mình trên Zoom, các mạng thần kinh nội bộ của EVA đã học cách ghép nối chuyển động của cơ bắp với cảnh quay video về khuôn mặt của chính nó. Giờ đây, EVA đã có ý thức sơ khai về cách khuôn mặt của chính nó hoạt động (được gọi là “hình ảnh tự chụp”), nó đã sử dụng mạng thứ hai để ghép hình ảnh tự chụp của chính mình với hình ảnh khuôn mặt người được chụp trên máy quay video của nó. Sau nhiều lần cải tiến và lặp lại, EVA đã có được khả năng đọc cử chỉ khuôn mặt người từ máy ảnh và phản hồi bằng cách phản chiếu nét mặt của con người đó.

Các nhà nghiên cứu lưu ý rằng EVA là một thí nghiệm trong phòng thí nghiệm và chỉ tính năng bắt chước vẫn còn khác xa so với những cách thức phức tạp mà con người giao tiếp bằng biểu cảm khuôn mặt. Nhưng những công nghệ cho phép như vậy một ngày nào đó có thể có những ứng dụng có lợi trong thế giới thực. Ví dụ, robot có khả năng phản ứng với nhiều loại ngôn ngữ cơ thể của con người sẽ hữu ích ở nơi làm việc, bệnh viện, trường học và nhà riêng.

Lipson cho biết: “Có một giới hạn về mức độ mà con người chúng ta có thể tương tác về mặt cảm xúc với các chatbot dựa trên đám mây hoặc những chiếc loa thông minh rời rạc trong nhà,” Lipson nói. "Bộ não của chúng ta dường như phản ứng tốt với các robot có một số loại hiện diện vật lý dễ nhận biết."

Chen nói thêm, “Robot gắn bó với nhau trong cuộc sống của chúng ta theo một số cách ngày càng tăng, vì vậy hãy xây dựng lòng tin giữa con người và máy ngày càng quan trọng. ”