웹 크롤링을 이용한 유해사이트 수집 방법
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 추승용 | - |
dc.contributor.author | 황예성 | - |
dc.contributor.author | 이상진 | - |
dc.date.accessioned | 2022-03-08T09:41:40Z | - |
dc.date.available | 2022-03-08T09:41:40Z | - |
dc.date.created | 2022-02-10 | - |
dc.date.issued | 2021 | - |
dc.identifier.issn | 1976-5304 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/138210 | - |
dc.description.abstract | 최근 정부의 유해사이트 차단 노력에도 불구하고 이를 우회하는 방법이 계속 생겨나고 있어 유해사이트는 여전히 줄어들지 않고 있다. 지속적이고 적극적인 유해사이트의 차단을 위해서는 유해사이트의 정보를 다양하게 수집하고 관리하는 시스템이 필요하다. 본 논문에서는 유해사이트의 링크를 모아놓은 웹사이트를 이용하여 효과적으로 유해사이트 정보를 수집하는 웹 크롤러를 제안한다. 제안한 웹 크롤러는 유해사이트의 다양한 정보를 수집한다. 특히 유해사이트 홍보 수단인 SNS(Social Networking Service)를 추적하여 변경될 URL 정보를 수집하고, Cloudflare와 같은 CDN(Content Delivery Network) 서비스 사용 여부를 확인하여 유해사이트의 운영 형태를 파악할 수 있다. 제안한 웹 크롤러를 이용해 수집한 결과 약 95%의 유해사이트 판별율(456개 중 433개)을 보였다. 따라서 제안한 웹 크롤러가 앞으로의 유해사이트 차단을 위한 정책 수립에 도움을 줄 수 있을 것으로 기대한다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국디지털포렌식학회 | - |
dc.title | 웹 크롤링을 이용한 유해사이트 수집 방법 | - |
dc.title.alternative | Methods for Collecting Harmful Websites Using Web Crawling | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 이상진 | - |
dc.identifier.doi | 10.22798/kdfs.2021.15.3.127 | - |
dc.identifier.bibliographicCitation | 디지털포렌식연구, v.15, no.3, pp.127 - 138 | - |
dc.relation.isPartOf | 디지털포렌식연구 | - |
dc.citation.title | 디지털포렌식연구 | - |
dc.citation.volume | 15 | - |
dc.citation.number | 3 | - |
dc.citation.startPage | 127 | - |
dc.citation.endPage | 138 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002765141 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Copyright Digital Forensics | - |
dc.subject.keywordAuthor | Harmful Websites | - |
dc.subject.keywordAuthor | Web Crawling | - |
dc.subject.keywordAuthor | 웹 크롤링 | - |
dc.subject.keywordAuthor | 유해사이트 | - |
dc.subject.keywordAuthor | 저작권 디지털 포렌식 | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
145 Anam-ro, Seongbuk-gu, Seoul, 02841, Korea+82-2-3290-2963
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.