AI Belajar Mengamalkan Tingkah Laku Manusia Dari Video

Kemas kini: 9 Disember 2023

Meramalkan apa yang akan dilakukan seseorang seterusnya berdasarkan bahasa badan mereka secara semula jadi bagi manusia tetapi tidak demikian untuk komputer. Apabila kita bertemu dengan orang lain, mereka mungkin akan menyambut kita dengan salam, berjabat tangan, atau bahkan kepalan tangan. Kita mungkin tidak tahu gerak isyarat mana yang akan digunakan, tetapi kita dapat membaca situasinya dan memberi respons yang tepat.

Dalam satu kajian baru, penyelidik Columbia Engineering mendedahkan sebuah AI teknik penglihatan untuk memberi mesin rasa yang lebih intuitif untuk apa yang akan berlaku seterusnya dengan memanfaatkan persatuan peringkat lebih tinggi antara manusia, haiwan dan objek.

Algoritma ialah satu langkah ke arah mesin dapat membuat ramalan yang lebih baik tentang tingkah laku manusia, dan dengan itu menyelaraskan tindakan mereka dengan lebih baik dengan tindakan kami dan bilangan kemungkinan untuk kerjasama manusia-robot, kenderaan autonomi dan bantuan. teknologi.

Ini kaedah paling tepat setakat ini untuk meramalkan peristiwa aksi video hingga beberapa minit di masa depan, kata para penyelidik. Setelah menganalisis ribuan jam filem, permainan sukan, dan pertunjukan seperti "The Office", sistem belajar untuk meramalkan beratus-ratus aktiviti, dari berjabat tangan hingga penumbukan penumbuk. Apabila tidak dapat meramalkan tindakan tertentu, ia akan menemukan konsep tingkat tinggi yang menghubungkan mereka, dalam hal ini, kata "salam."

Percubaan masa lalu dalam pembelajaran mesin ramalan, termasuk yang dilakukan oleh pasukan, telah menumpukan pada meramalkan hanya satu tindakan pada satu masa. Algoritma memutuskan sama ada untuk mengklasifikasikan tindakan sebagai pelukan, lima tinggi, jabat tangan, atau bukan tindakan seperti "abaikan." Tetapi apabila ketidakpastian tinggi, kebanyakan model pembelajaran mesin tidak dapat menemui kesamaan antara kemungkinan pilihan.

Penyelidik memutuskan untuk melihat masalah ramalan jarak jauh dari sudut yang berbeza. Tidak semua perkara di masa depan dapat diramalkan, kata penyelidik. Apabila seseorang tidak dapat meramalkan dengan tepat apa yang akan berlaku, mereka memainkannya dengan selamat dan meramalkan pada tahap pengabstrakan yang lebih tinggi. Algoritma kami adalah yang pertama mempelajari keupayaan ini untuk memberi alasan secara abstrak mengenai peristiwa masa depan. "

Penyelidik harus meninjau semula soalan dalam matematik yang wujud sejak zaman Yunani kuno. Di sekolah menengah, pelajar mempelajari peraturan geometri yang biasa dan intuitif - garis lurus menjadi lurus, garis selari tidak pernah melintas. Sebilangan besar sistem pembelajaran mesin juga mematuhi peraturan ini. Tetapi geometri lain, bagaimanapun, mempunyai sifat pelik dan intuitif yang pelik; garis lurus selekoh dan segitiga membonjol. Penyelidik menggunakan geometri luar biasa ini untuk membina model AI yang menyusun konsep peringkat tinggi dan meramalkan tingkah laku manusia pada masa akan datang.

Ramalan adalah asas kecerdasan manusia, saintis di Massachusetts Institute of Technology dan pengarah bersama MIT-IBM Watson AI Lab, seorang pakar dalam AI dan kognisi manusia yang tidak terlibat dalam kajian ini. "Mesin membuat kesilapan yang tidak akan pernah dilakukan manusia kerana mereka tidak memiliki kemampuan untuk membuat alasan secara abstrak. Karya ini merupakan langkah penting untuk merapatkan jurang teknologi ini. "

Kerangka matematik yang dikembangkan oleh penyelidik membolehkan mesin mengatur acara dengan seberapa ramalannya di masa depan. Sebagai contoh, kita tahu bahawa berenang dan berlari adalah kedua-dua bentuk latihan. Teknik baru belajar bagaimana mengkategorikan aktiviti ini sendiri. Sistem ini menyedari ketidakpastian, memberikan tindakan yang lebih spesifik apabila ada kepastian, dan ramalan yang lebih umum jika tidak ada.

Teknik ini dapat menggerakkan komputer lebih dekat untuk dapat mengukur situasi dan membuat keputusan yang bernuansa, bukannya tindakan yang diprogramkan, kata para penyelidik. Ini adalah langkah penting dalam membangun kepercayaan antara manusia dan komputer, "Kepercayaan berasal dari perasaan bahawa robot benar-benar memahami orang," jelasnya. "Sekiranya mesin dapat memahami dan menjangka tingkah laku kita, komputer akan dapat membantu orang dalam aktiviti seharian dengan lancar."

Walaupun algoritma baru membuat ramalan yang lebih tepat mengenai tugas penanda aras daripada kaedah sebelumnya, langkah seterusnya adalah untuk mengesahkan bahawa ia berfungsi di luar makmal, Sekiranya sistem dapat berfungsi dalam pelbagai tetapan, ada banyak kemungkinan untuk menggunakan mesin dan robot yang dapat meningkatkan keselamatan, kesihatan, dan keselamatan, kata para penyelidik. Kumpulan ini merancang untuk terus meningkatkan prestasi algoritma dengan set data dan komputer yang lebih besar, dan bentuk geometri lain.

Tingkah laku manusia sering mengejutkan dan algoritma memungkinkan mesin untuk lebih menjangka apa yang akan mereka lakukan seterusnya. "

Kajian ini bertajuk "Mempelajari ramalan masa depan."