Penyelidik Mengawal Selaraskan Penjanaan Gambar AI

Kemas kini: 1 Jun 2021
Penyelidik Mengawal Selaraskan Penjanaan Gambar AI

Penyelidik dari North Carolina State University telah mengembangkan kaedah canggih baru untuk mengawal bagaimana sistem kecerdasan buatan (AI) membuat gambar. Karya ini mempunyai aplikasi untuk bidang dari robotik autonomi hingga latihan AI.

Yang dimaksudkan adalah jenis tugas AI yang disebut penjanaan gambar bersyarat, di mana sistem AI membuat gambar yang memenuhi sekumpulan syarat tertentu. Sebagai contoh, sistem dapat dilatih untuk membuat gambar kucing atau anjing asli, bergantung pada haiwan mana yang diminta pengguna. Teknik yang lebih baru dibangunkan untuk memasukkan syarat mengenai susun atur gambar. Ini membolehkan pengguna menentukan jenis objek yang ingin mereka tampilkan di tempat-tempat tertentu di layar. Contohnya, langit mungkin masuk dalam satu kotak, pokok mungkin berada di dalam kotak lain, aliran mungkin berada dalam kotak yang terpisah, dan sebagainya.

Karya baru menggunakan teknik tersebut untuk memberi pengguna lebih banyak kawalan terhadap gambar yang dihasilkan, dan mengekalkan ciri-ciri tertentu di sebilangan gambar.

"Pendekatan kami sangat dapat dikonfigurasi semula," kata Tianfu Wu, pengarang bersama makalah mengenai pekerjaan itu dan penolong profesor kejuruteraan komputer di NC State. "Seperti pendekatan sebelumnya, kami memungkinkan pengguna agar sistem menghasilkan gambar berdasarkan sekumpulan syarat tertentu. Tetapi gambar kami juga membolehkan anda mengekalkan gambar itu dan menambahkannya. Sebagai contoh, pengguna boleh membuat AI membuat pemandangan gunung. Pengguna kemudian dapat meminta sistem menambahkan pemain ski ke tempat kejadian itu. "

Di samping itu, pendekatan baru ini membolehkan pengguna memiliki AI memanipulasi elemen tertentu sehingga mereka sama, tetapi telah berpindah atau berubah dalam beberapa cara. Sebagai contoh, AI mungkin membuat rangkaian gambar yang menunjukkan pemain ski berpaling ke arah penonton ketika mereka bergerak melintasi lanskap.

"Satu aplikasi untuk ini adalah untuk membantu robot autonomi 'membayangkan' bagaimana hasil akhirnya sebelum mereka memulakan tugas tertentu," kata Wu. “Anda juga dapat menggunakan sistem untuk menghasilkan gambar untuk latihan AI. Jadi, daripada menyusun gambar dari sumber luaran, anda boleh menggunakan sistem ini untuk membuat gambar untuk melatih sistem AI yang lain. "

Para penyelidik menguji pendekatan baru mereka menggunakan set data COCO-Stuff dan kumpulan data Visual Genome. Berdasarkan ukuran standard kualiti gambar, pendekatan baru ini mengungguli teknik pembuatan gambar canggih sebelumnya.

"Langkah kami seterusnya adalah untuk melihat apakah kami dapat memperluas karya ini ke gambar video dan tiga dimensi," kata Wu.

Latihan untuk pendekatan baru memerlukan sejumlah besar kekuatan komputasi; penyelidik menggunakan stesen kerja 4-GPU. Walau bagaimanapun, penggunaan sistem ini lebih murah dari segi perhitungan.

"Kami menjumpainya GPU memberi anda kelajuan hampir masa nyata, ”kata Wu