그래프 기반의 피싱 URL 탐지

피싱을 통한 사이버 범죄가 늘어나고 있다. 피싱이 초래하는 피해를 방지하기 위해 콘텐츠 기반, URL 문자열 기반 등 많은 피싱 URL 관련 연구들이 진행되어 왔다. 콘텐츠 기반 방법은 웹 페이지콘텐츠를 다운로드하고 분석하는 방법으로, 보안상 위험이 따르는 단점이 존재한다. URL 문자열 기반 방법은 URL 문자열 패턴을 분석하고 이를 피싱 URL 탐지에 사용한다. 본 논문에서는 기존 연구로부터 확인된 피싱 URL의 경향에서 착안하여, URL 문자열을 그래프로 구축하고 Random Walk with Restart, Belief Pr...

Full description

Saved in:
Bibliographic Details
Published in정보과학회 컴퓨팅의 실제 논문지 Vol. 26; no. 3; pp. 156 - 160
Main Authors 김태리(Taeri Kim), 홍지원(Jiwon Hong), 박노성(Noseong Park), 김상욱(Sang-Wook Kim)
Format Journal Article
LanguageKorean
Published Korean Institute of Information Scientists and Engineers 01.03.2020
한국정보과학회
Subjects
Online AccessGet full text
ISSN2383-6318
2383-6326
DOI10.5626/KTCP.2020.26.3.156

Cover

Loading…
More Information
Summary:피싱을 통한 사이버 범죄가 늘어나고 있다. 피싱이 초래하는 피해를 방지하기 위해 콘텐츠 기반, URL 문자열 기반 등 많은 피싱 URL 관련 연구들이 진행되어 왔다. 콘텐츠 기반 방법은 웹 페이지콘텐츠를 다운로드하고 분석하는 방법으로, 보안상 위험이 따르는 단점이 존재한다. URL 문자열 기반 방법은 URL 문자열 패턴을 분석하고 이를 피싱 URL 탐지에 사용한다. 본 논문에서는 기존 연구로부터 확인된 피싱 URL의 경향에서 착안하여, URL 문자열을 그래프로 구축하고 Random Walk with Restart, Belief Propagation과 같은 그래프 추론 알고리즘과 DeepWalk, Node2vec과 같은 그래프 임베딩 기법을통해 URL의 피싱 여부를 예측한다. 우리의 그래프 기반 피싱 URL 탐지 방법과 분류 알고리즘을 활용한기존 피싱 URL 탐지 방법을 비교한 결과, 그래프 기반 방법이 모든 정확도 척도에서 더 높은 성능을 보였다. Cyber crime through phishing is on the rise. To prevent the damage caused by phishing attacks, many studies to detect phishing URLs such as content-based and string-based have been conducted. A content-based method is a method of downloading and analyzing web page content, which poses a security risk. The string-based method analyzes URL string patterns and uses them for phishing URL detection. In this paper, we construct a graph with URL strings based on the phishing URL trends identified from previous studies. And, we detect phishing URLs through the graph-based inference algorithms such as Random Walk with Restart, Belief Propagation, and graph embedding methods such as DeepWalk, Node2vec. As a result of comparing our graph-based phishing URL detection method with the conventional phishing URL detection methods, our method shows better prediction performance in all accuracy measures. KCI Citation Count: 0
ISSN:2383-6318
2383-6326
DOI:10.5626/KTCP.2020.26.3.156