웹 크롤링을 이용한 유해사이트 수집 방법Methods for Collecting Harmful Websites Using Web Crawling
- Other Titles
- Methods for Collecting Harmful Websites Using Web Crawling
- Authors
- 추승용; 황예성; 이상진
- Issue Date
- 2021
- Publisher
- 한국디지털포렌식학회
- Keywords
- Copyright Digital Forensics; Harmful Websites; Web Crawling; 웹 크롤링; 유해사이트; 저작권 디지털 포렌식
- Citation
- 디지털포렌식연구, v.15, no.3, pp.127 - 138
- Indexed
- KCI
- Journal Title
- 디지털포렌식연구
- Volume
- 15
- Number
- 3
- Start Page
- 127
- End Page
- 138
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/138210
- DOI
- 10.22798/kdfs.2021.15.3.127
- ISSN
- 1976-5304
- Abstract
- 최근 정부의 유해사이트 차단 노력에도 불구하고 이를 우회하는 방법이 계속 생겨나고 있어 유해사이트는 여전히 줄어들지 않고 있다. 지속적이고 적극적인 유해사이트의 차단을 위해서는 유해사이트의 정보를 다양하게 수집하고 관리하는 시스템이 필요하다. 본 논문에서는 유해사이트의 링크를 모아놓은 웹사이트를 이용하여 효과적으로 유해사이트 정보를 수집하는 웹 크롤러를 제안한다. 제안한 웹 크롤러는 유해사이트의 다양한 정보를 수집한다. 특히 유해사이트 홍보 수단인 SNS(Social Networking Service)를 추적하여 변경될 URL 정보를 수집하고, Cloudflare와 같은 CDN(Content Delivery Network) 서비스 사용 여부를 확인하여 유해사이트의 운영 형태를 파악할 수 있다. 제안한 웹 크롤러를 이용해 수집한 결과 약 95%의 유해사이트 판별율(456개 중 433개)을 보였다. 따라서 제안한 웹 크롤러가 앞으로의 유해사이트 차단을 위한 정책 수립에 도움을 줄 수 있을 것으로 기대한다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - School of Cyber Security > Department of Information Security > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.