Teknik Keamanan Siber Honeypot Juga Dapat Menghentikan Serangan dalam Pemprosesan Bahasa Semula Jadi

Kemas kini: 29 Julai 2021
Teknik Keamanan Siber Honeypot Juga Dapat Menghentikan Serangan dalam Pemprosesan Bahasa Semula Jadi

Apabila pengesan berita palsu dalam talian dan penapis spam menjadi lebih canggih, begitu juga kaedah penyerang untuk menipu mereka—termasuk serangan melalui "pencetus universal". Dalam kaedah berasaskan pembelajaran ini, penyerang menggunakan frasa atau set perkataan untuk memperdayakan bilangan input yang tidak ditentukan. Serangan yang berjaya boleh bermakna lebih banyak berita palsu muncul dalam suapan media sosial anda atau spam yang sampai ke peti masuk e-mel anda. Meminjam teknik yang biasa digunakan dalam keselamatan siber untuk mempertahankan diri daripada serangan berasaskan pencetus universal ini, penyelidik di Kolej Sains Maklumat Penn State dan Teknologi telah membangunkan rangka kerja pembelajaran mesin yang boleh mempertahankan secara proaktif terhadap jenis serangan yang sama dalam aplikasi pemprosesan bahasa semula jadi 99% pada setiap masa.

Model, yang disebut DARCY, menggunakan konsep keamanan siber yang dikenal sebagai "honeypot" untuk umpan dan menangkap kemungkinan serangan terhadap aplikasi pemprosesan bahasa semula jadi, seperti pengesan berita palsu dan penapis spam. Berkhidmat sebagai umpan, honeypot menarik penyerang dengan menarik mereka ke kata-kata dan frasa yang mereka sasarkan dalam peretasan mereka.

"Penyerang cuba mencari frasa serangan universal ini, jadi kami berusaha menjadikannya sangat menarik bagi mereka untuk mencari frasa yang telah kami tetapkan," kata Thai Le, pelajar kedoktoran sains maklumat dan teknologi dan penulis utama di kertas penyelidikan. "Kami berusaha menjadikan pekerjaan menyerang sangat mudah bagi mereka, dan kemudian mereka terjebak."

DARCY mencari dan menyuntik banyak perangkap, atau umpan, ke dalam rangkaian neural teks - teknologi yang mendorong aplikasi pemprosesan bahasa semula jadi - untuk menangkap dan menyaring kandungan berbahaya yang dihasilkan oleh serangan pencetus universal.

"Sejauh yang kita ketahui, ini adalah karya pertama yang menggunakan konsep honeypot dari domain keamanan siber dalam mempertahankan model jaringan saraf teks terhadap serangan musuh," kata Dongwon Lee, profesor sains dan teknologi maklumat dan penyelidik utama proyek tersebut.

Le menjelaskan bahawa kaedah pertahanan semasa terhadap serangan musuh sebagian besar reaktif, yang bermaksud bahawa para pembela mesti memerhatikan dan mempelajari teknik penggodam setelah serangan dan kemudian menunggu serangan lain untuk mengesan dan menghapusnya.

Dengan DARCY, idea baru mengenai pendekatan pertahanan proaktif dapat membantu mengesan dan mencegah serangan.

"Apa yang biasa dilakukan orang adalah melatih a pembelajaran mesin model dan kemudian cuba mempertahankannya setelah dilatih, ”kata Le. "Tetapi apa yang kami coba lakukan adalah mempertahankan selama proses latihan sehingga kami melindungi model secara proaktif selama fasa latihan."

Para penyelidik menguji DARCY pada empat kumpulan data klasifikasi teks yang berasingan dan menggunakan kerangka untuk mempertahankan diri dari enam senario serangan berpotensi yang berbeza, seperti sama ada penyerang mempunyai akses ke rangkaian pengesanan atau jika mereka mengetahui trapdoors tertanam. DARCY mengatasi lima algoritma pengesanan lawan yang ada yang berfungsi sebagai garis pertahanan.

"Sebagai contoh, DARCY dapat mengesan serangan musuh berdasarkan pencetus universal dengan kadar positif hingga 99% dan kadar positif palsu kurang dari 2% dalam kebanyakan kes, yang merupakan peningkatan yang signifikan daripada garis dasar yang ada," kata Lee.

Melihat keberkesanan penggunaan taktik pertahanan keselamatan siber yang berjaya untuk mempertahankan aplikasi pemprosesan bahasa semula jadi, para penyelidik berharap dapat menggunakan teknik dan kerangka yang sama untuk mencegah jenis serangan lain di masa depan.

"Menerapkan konsep dari bidang yang sangat berbeza sangat menarik, kerana kita dapat melihat bagaimana bidang yang berbeza saling berhubungan dan bagaimana payung keselamatan dapat diterapkan pada banyak aspek yang berbeza dalam sains komputer," Le menyimpulkan.