AI học cách dự đoán hành vi của con người từ video

Dự đoán ai đó sắp làm gì tiếp theo dựa trên ngôn ngữ cơ thể của họ đến với con người một cách tự nhiên nhưng với máy tính thì không. Khi chúng ta gặp một người khác, họ có thể chào chúng ta bằng một cái chào, cái bắt tay hoặc thậm chí là cái nắm tay. Chúng tôi có thể không biết cử chỉ nào sẽ được sử dụng, nhưng chúng tôi có thể đọc tình huống và phản ứng phù hợp.

Trong một nghiên cứu mới, các nhà nghiên cứu của Columbia Engineering đã tiết lộ một AI kỹ thuật thị giác giúp máy móc có cảm giác trực quan hơn về những gì sẽ xảy ra tiếp theo bằng cách tận dụng các mối liên hệ ở cấp độ cao hơn giữa con người, động vật và đồ vật.

Thuật toán là một bước hướng tới việc máy móc có thể đưa ra dự đoán tốt hơn về hành vi của con người và do đó phối hợp tốt hơn hành động của chúng với hành động của chúng ta cũng như nhiều khả năng hợp tác giữa con người và robot, phương tiện tự hành và hỗ trợ. công nghệ.

Các nhà nghiên cứu cho biết đây là phương pháp chính xác nhất cho đến nay để dự đoán các sự kiện hành động video lên đến vài phút trong tương lai. Sau khi phân tích hàng nghìn giờ phim, trò chơi thể thao và chương trình như “The Office”, hệ thống sẽ học cách dự đoán hàng trăm hoạt động, từ bắt tay đến va chạm bằng nắm đấm. Khi nó không thể dự đoán hành động cụ thể, nó sẽ tìm ra khái niệm cấp cao hơn để liên kết chúng, trong trường hợp này là từ “lời chào”.

Những nỗ lực trước đây trong việc học máy dự đoán, bao gồm cả những nỗ lực của nhóm, đã tập trung vào việc dự đoán chỉ một hành động tại một thời điểm. Các thuật toán quyết định phân loại hành động là ôm, cao năm, bắt tay hay thậm chí là không hành động như “bỏ qua”. Nhưng khi độ không chắc chắn cao, hầu hết các mô hình học máy không thể tìm thấy điểm chung giữa các tùy chọn khả thi.

Các nhà nghiên cứu quyết định xem xét vấn đề dự đoán tầm xa hơn từ một góc độ khác. Các nhà nghiên cứu cho biết không phải mọi thứ trong tương lai đều có thể đoán trước được. Khi một người không thể đoán trước chính xác điều gì sẽ xảy ra, họ chơi nó an toàn và dự đoán ở mức độ trừu tượng cao hơn. Thuật toán của chúng tôi là thuật toán đầu tiên học được khả năng này để lập luận một cách trừu tượng về các sự kiện trong tương lai. "

Các nhà nghiên cứu phải xem lại các câu hỏi trong toán học có từ thời Hy Lạp cổ đại. Ở trường trung học, học sinh học các quy tắc trực quan và quen thuộc của hình học — đường thẳng đi thẳng, đường thẳng song song không bao giờ cắt nhau. Hầu hết các hệ thống học máy cũng tuân theo các quy tắc này. Tuy nhiên, các hình học khác có những đặc tính kỳ lạ, phản trực giác; đường thẳng uốn cong và hình tam giác phồng lên. Các nhà nghiên cứu đã sử dụng những hình học bất thường này để xây dựng các mô hình AI tổ chức các khái niệm cấp cao và dự đoán hành vi của con người trong tương lai.

Dự đoán là cơ sở của trí thông minh con người, nhà khoa học tại Viện Công nghệ Massachusetts và đồng giám đốc Phòng thí nghiệm MIT-IBM Watson AI, một chuyên gia về AI và nhận thức của con người không tham gia vào nghiên cứu. “Máy móc mắc những sai lầm mà con người không bao giờ mắc phải vì chúng thiếu khả năng suy luận trừu tượng của chúng ta. Công việc này là một bước quan trọng để thu hẹp khoảng cách công nghệ này. "

Khung toán học do các nhà nghiên cứu phát triển cho phép máy móc tổ chức các sự kiện theo mức độ dự đoán của chúng trong tương lai. Ví dụ, chúng ta biết rằng bơi và chạy đều là hai hình thức rèn luyện sức khỏe. Kỹ thuật mới học cách tự phân loại các hoạt động này. Hệ thống nhận thức được sự không chắc chắn, cung cấp các hành động cụ thể hơn khi có sự chắc chắn và các dự đoán chung chung hơn khi không có.

Các nhà nghiên cứu cho biết, kỹ thuật này có thể di chuyển máy tính đến gần hơn để có thể xác định kích thước tình huống và đưa ra quyết định sắc thái, thay vì một hành động được lập trình trước. Đó là một bước quan trọng trong việc xây dựng lòng tin giữa con người và máy tính, “Niềm tin đến từ cảm giác rằng robot thực sự hiểu con người,” ông giải thích. “Nếu máy móc có thể hiểu và dự đoán các hành vi của chúng ta, máy tính sẽ có thể hỗ trợ con người một cách liền mạch trong hoạt động hàng ngày.”

Mặc dù thuật toán mới đưa ra dự đoán chính xác hơn về các tác vụ điểm chuẩn so với các phương pháp trước đó, nhưng các bước tiếp theo là xác minh rằng nó hoạt động bên ngoài phòng thí nghiệm, Nếu hệ thống có thể hoạt động trong các cài đặt đa dạng, có nhiều khả năng triển khai máy móc và rô bốt có thể cải thiện các nhà nghiên cứu cho biết an toàn, sức khỏe và bảo mật. Nhóm có kế hoạch tiếp tục cải thiện hiệu suất của thuật toán với các bộ dữ liệu và máy tính lớn hơn, cũng như các dạng hình học khác.

Hành vi của con người thường đáng ngạc nhiên và các thuật toán cho phép máy để dự đoán tốt hơn những gì họ sẽ làm tiếp theo. "

Nghiên cứu có tiêu đề "Học khả năng dự đoán của tương lai."