AI Belajar Memprediksi Perilaku Manusia Dari Video

Pembaruan: 9 Desember 2023

Memprediksi apa yang akan dilakukan seseorang selanjutnya berdasarkan bahasa tubuh mereka datang secara alami kepada manusia tetapi tidak demikian untuk komputer. Ketika kita bertemu orang lain, mereka mungkin menyapa kita dengan salam, jabat tangan, atau bahkan tinju. Kita mungkin tidak tahu gerakan mana yang akan digunakan, tetapi kita bisa membaca situasi dan merespons dengan tepat.

Dalam sebuah studi baru, peneliti Columbia Engineering mengungkap AI teknik penglihatan untuk memberi mesin pemahaman yang lebih intuitif tentang apa yang akan terjadi selanjutnya dengan memanfaatkan asosiasi tingkat tinggi antara manusia, hewan, dan objek.

Algoritma adalah sebuah langkah menuju kemampuan mesin untuk membuat prediksi yang lebih baik tentang perilaku manusia, dan dengan demikian mengoordinasikan tindakan mereka dengan tindakan kita dan sejumlah kemungkinan untuk kolaborasi manusia-robot, kendaraan otonom, dan alat bantu. teknologi.

Ini adalah metode paling akurat hingga saat ini untuk memprediksi peristiwa aksi video hingga beberapa menit di masa depan, kata para peneliti. Setelah menganalisis ribuan jam film, permainan olahraga, dan acara seperti "The Office", sistem belajar memprediksi ratusan aktivitas, mulai dari berjabat tangan hingga berbenturan kepalan tangan. Ketika tidak dapat memprediksi tindakan tertentu, ia menemukan konsep tingkat yang lebih tinggi yang menghubungkannya, dalam hal ini, kata "sapaan".

Upaya sebelumnya dalam pembelajaran mesin prediktif, termasuk yang dilakukan oleh tim, telah berfokus pada memprediksi hanya satu tindakan pada satu waktu. Algoritme memutuskan apakah akan mengklasifikasikan tindakan sebagai pelukan, tos, jabat tangan, atau bahkan non-tindakan seperti "abaikan." Tetapi ketika ketidakpastian tinggi, sebagian besar model pembelajaran mesin tidak dapat menemukan kesamaan di antara opsi yang memungkinkan.

Para peneliti memutuskan untuk melihat masalah prediksi jarak jauh dari sudut yang berbeda. Tidak semua hal di masa depan dapat diprediksi, kata para peneliti. Ketika seseorang tidak dapat meramalkan dengan tepat apa yang akan terjadi, mereka memainkannya dengan aman dan memprediksi pada tingkat abstraksi yang lebih tinggi. Algoritme kami adalah yang pertama mempelajari kemampuan ini untuk bernalar secara abstrak tentang peristiwa di masa depan.”

Para peneliti harus meninjau kembali pertanyaan-pertanyaan dalam matematika yang berasal dari zaman Yunani kuno. Di sekolah menengah, siswa mempelajari aturan geometri yang familiar dan intuitif—bahwa garis lurus lurus, garis paralel tidak pernah bersilangan. Sebagian besar sistem pembelajaran mesin juga mematuhi aturan ini. Tapi geometri lain, bagaimanapun, memiliki sifat aneh, kontra-intuitif; garis lurus menekuk dan segitiga menonjol. Para peneliti menggunakan geometri yang tidak biasa ini untuk membangun model AI yang mengatur konsep tingkat tinggi dan memprediksi perilaku manusia di masa depan.

Prediksi adalah dasar kecerdasan manusia, ilmuwan di Massachusetts Institute of Technology dan co-director MIT-IBM Watson AI Lab, seorang ahli AI dan kognisi manusia yang tidak terlibat dalam penelitian ini. “Mesin membuat kesalahan yang tidak akan pernah dilakukan manusia karena mereka tidak memiliki kemampuan untuk menalar secara abstrak. Pekerjaan ini merupakan langkah penting untuk menjembatani kesenjangan teknologi ini.”

Kerangka matematis yang dikembangkan oleh para peneliti memungkinkan mesin untuk mengatur peristiwa dengan seberapa dapat diprediksi mereka di masa depan. Misalnya, kita tahu bahwa berenang dan berlari adalah dua bentuk olahraga. Teknik baru belajar bagaimana mengkategorikan kegiatan ini sendiri. Sistem menyadari ketidakpastian, memberikan tindakan yang lebih spesifik ketika ada kepastian, dan prediksi yang lebih umum ketika tidak ada.

Teknik ini dapat menggerakkan komputer lebih dekat untuk dapat mengukur situasi dan membuat keputusan yang bernuansa, alih-alih tindakan yang telah diprogram sebelumnya, kata para peneliti. Ini adalah langkah penting dalam membangun kepercayaan antara manusia dan komputer, “Kepercayaan berasal dari perasaan bahwa robot benar-benar memahami manusia,” jelasnya. “Jika mesin dapat memahami dan mengantisipasi perilaku kita, komputer akan dapat dengan lancar membantu orang dalam aktivitas sehari-hari.”

Sementara algoritme baru membuat prediksi yang lebih akurat pada tugas benchmark daripada metode sebelumnya, langkah selanjutnya adalah memverifikasi bahwa itu berfungsi di luar lab, Jika sistem dapat bekerja dalam pengaturan yang beragam, ada banyak kemungkinan untuk menerapkan mesin dan robot yang dapat meningkatkan kinerja kami. keselamatan, kesehatan, dan keamanan, kata para peneliti. Grup berencana untuk terus meningkatkan kinerja algoritme dengan kumpulan data dan komputer yang lebih besar, dan bentuk geometri lainnya.

Perilaku manusia sering kali mengejutkan dan algoritme memungkinkan mesin untuk mengantisipasi dengan lebih baik apa yang akan mereka lakukan selanjutnya.”

Studi ini berjudul "Mempelajari prediktabilitas masa depan."