허니팟 사이버 보안 기술로 자연어 처리 공격도 차단 가능

Honeypot 사이버 보안 기술은 자연어 처리에서도 공격을 막을 수 있습니다

온라인 가짜 뉴스 탐지기와 스팸 필터가 더욱 정교해짐에 따라 "보편적 트리거"를 통한 공격을 포함하여 이를 속이는 공격자의 방법도 더욱 정교해졌습니다. 이 학습 기반 방법에서 공격자는 구문이나 단어 집합을 사용하여 무한한 수의 입력을 속입니다. 공격이 성공하면 소셜 미디어 피드에 더 많은 가짜 뉴스가 나타나거나 이메일 받은 편지함에 스팸이 도달할 수 있습니다. Penn State College of Information Sciences의 연구원들은 이러한 보편적인 트리거 기반 공격을 방어하기 위해 사이버 보안에 일반적으로 사용되는 기술을 차용했습니다. Technology 자연어 처리 애플리케이션에서 동일한 유형의 공격을 99% 사전 예방적으로 방어할 수 있는 기계 학습 프레임워크를 개발했습니다.

DARCY라는 모델은 "허니팟(honeypot)"이라는 사이버 보안 개념을 사용하여 가짜 뉴스 탐지기 및 스팸 필터와 같은 자연어 처리 애플리케이션에 대한 잠재적 공격을 미끼로 잡아냅니다. 미끼 역할을 하는 허니팟은 해킹에서 표적으로 삼고 있는 단어와 구문으로 공격자를 끌어들여 공격자를 유인합니다.

이 연구 논문의 주저자이자 정보 과학 및 기술 박사 과정 학생인 Thai Le는 "공격자는 이러한 보편적인 공격 문구를 찾으려고 노력하므로 우리가 이미 설정한 문구를 찾는 것이 매우 매력적이도록 하려고 합니다."라고 말했습니다. "우리는 공격 작업을 매우 쉽게 만들려고 노력하지만 함정에 빠지게 됩니다."

DARCY는 자연어 처리 애플리케이션을 구동하는 기술인 텍스트 신경망에 여러 트랩도어 또는 미끼를 검색하고 주입하여 범용 트리거 공격에 의해 생성된 악성 콘텐츠를 포착하고 필터링합니다.

이동원 정보과학기술부 교수이자 프로젝트 책임연구원은 “우리가 아는 한, 이것은 텍스트 신경망 모델을 적대적 공격으로부터 방어하기 위해 사이버 보안 도메인의 허니팟 개념을 활용한 첫 번째 작업”이라고 말했다.

Le는 적대적 공격에 대한 현재의 방어 방법이 대체로 반응적이어서 방어자가 공격 후 해커의 기술을 관찰하고 학습한 다음 다른 공격이 탐지하고 제거할 때까지 기다려야 한다고 설명했습니다.

DARCY를 사용하면 사전 예방적 방어 접근 방식이라는 새로운 아이디어가 공격을 감지하고 방지하는 데 도움이 될 수 있습니다.

“사람들이 하던 일은 훈련 기계 학습 모델을 만들고 훈련된 후에 방어하려고 합니다.”라고 Le가 말했습니다. "하지만 우리가 하려고 하는 것은 훈련 과정에서 방어하여 훈련 단계에서 모델을 사전에 보호하는 것입니다."

연구원들은 XNUMX개의 개별 텍스트 분류 데이터 세트에서 DARCY를 테스트하고 공격자가 탐지 네트워크에 액세스했는지 여부 또는 내장된 트랩도어를 알고 있는지 여부와 같은 XNUMX가지 잠재적 공격 시나리오를 방어하기 위해 프레임워크를 사용했습니다. DARCY는 방어 기준선 역할을 하는 기존의 XNUMX가지 적대적 탐지 알고리즘을 훨씬 능가했습니다.

Lee는 "예를 들어 DARCY는 대부분의 경우 최대 99%의 참양성률과 2% 미만의 거짓양성률로 보편적인 트리거 기반 적대적 공격을 탐지할 수 있었으며 이는 기존 기준에 비해 크게 개선되었습니다."라고 말했습니다.

자연어 처리 응용 프로그램을 방어하기 위해 성공적인 사이버 보안 방어 전술을 사용하는 것의 효과를 보고 연구자들은 미래에 다른 유형의 공격을 방지하기 위해 동일한 기술과 프레임워크를 사용하기를 희망합니다.

Le는 "매우 다른 분야의 개념을 적용하는 것은 흥미롭습니다. 다른 분야가 서로 연결되는 방식과 보안 우산이 컴퓨터 과학의 다양한 측면에 어떻게 적용될 수 있는지 알 수 있기 때문입니다."라고 결론지었습니다.

Honeypot 사이버 보안 기술은 자연어 처리에서도 공격을 막을 수 있습니다