Menggunakan Teknik Generalisasi untuk menjadikan Sistem AI lebih serba boleh

Kemas kini: 2 Ogos 2021
Menggunakan Teknik Generalisasi untuk menjadikan Sistem AI lebih serba boleh

Sebuah kumpulan di DeepMind yang dipanggil Open-Ended Learning Team telah mengembangkan cara baru untuk melatih sistem AI untuk bermain permainan. Daripada mendedahkannya kepada jutaan permainan sebelumnya, seperti yang dilakukan dengan sistem AI yang bermain permainan lain, kumpulan di DeepMind telah memberikan agen sistem AI barunya satu set kemahiran minimum yang mereka gunakan untuk mencapai tujuan sederhana (seperti melihat pemain lain di dunia maya) dan kemudian membina di atasnya. Para penyelidik mencipta dunia maya yang dipanggil XLand - dunia maya berwarna-warni yang mempunyai penampilan permainan video umum. Di dalamnya, pemain AI, yang disebut oleh penyelidik sebagai agen, berangkat untuk mencapai tujuan umum, dan ketika mereka melakukannya, mereka memperoleh kemahiran yang dapat mereka gunakan untuk mencapai tujuan lain. Para penyelidik kemudian menukar permainan, memberikan ejen kepada mereka tujuan baru tetapi membolehkan mereka mengekalkan kemahiran yang telah mereka pelajari dalam permainan sebelumnya.

Salah satu contoh teknik ini melibatkan ejen yang cuba menuju ke bahagian dunianya yang terlalu tinggi untuk didaki secara langsung dan yang tidak ada jalan masuk seperti tangga atau tanjakan. Dengan tergesa-gesa, ejen mendapati bahawa ia dapat menggerakkan objek rata yang dijumpai untuk berfungsi sebagai tanjakan dan dengan itu melangkah ke tempat yang harus dilaluinya. Untuk membolehkan ejen mereka mempelajari lebih banyak kemahiran, para penyelidik membuat 700,000 senario atau permainan di mana ejen menghadapi kira-kira 3.4 juta tugas unik. Dengan menggunakan pendekatan ini, ejen dapat mengajar diri mereka sendiri bagaimana bermain pelbagai permainan, seperti tag, menangkap bendera dan bersembunyi. Para penyelidik menyebut pendekatan mereka mencabar tanpa henti. Aspek lain yang menarik dari XLand adalah bahawa ada semacam tuan, entiti yang memerhatikan ejen dan mencatat kemahiran mana yang mereka pelajari dan kemudian menghasilkan permainan baru untuk memperkuat kemahiran mereka. Dengan pendekatan ini, ejen akan terus belajar selagi mereka diberi tugas baru.

Dalam menjalankan dunia maya mereka, para penyelidik mendapati bahawa ejen mempelajari kemahiran baru, secara tidak sengaja, mereka mendapati berguna dan kemudian dibina di atasnya, yang membawa kepada kemahiran yang lebih maju seperti menggunakan percubaan ketika kehabisan pilihan, bekerjasama dengan ejen lain dan belajar bagaimana menggunakan objek sebagai alat. Mereka mencadangkan pendekatan mereka adalah langkah untuk mewujudkan algoritma yang mampu secara umum yang belajar bagaimana bermain permainan baru sendiri-kemahiran yang mungkin suatu hari akan digunakan oleh autonomi robot.