사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 김희두 | - |
dc.contributor.author | 임희석 | - |
dc.date.accessioned | 2022-05-17T15:41:46Z | - |
dc.date.available | 2022-05-17T15:41:46Z | - |
dc.date.created | 2022-05-17 | - |
dc.date.issued | 2022 | - |
dc.identifier.issn | 2233-4890 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/141140 | - |
dc.description.abstract | 본 연구는 딥러닝 기법을 활용하여 범죄 수사 도메인에 특화된 개체명 인식 모델을 개발하는 연구이다. 본 연구를 통해 비정형의 형사 판결문·수사 문서와 같은 텍스트 기반의 데이터에서 자동으로 범죄 수법과 범죄 관련 정보를 추출하고 유형화하여, 향후 데이터 분석기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있는 시스템을 제안한다. 본 연구에서는 범죄 수사 도메인 텍스트를 수집하고 범죄 분석의 관점에서 필요한 개체명 분류를 새로 정의하였다. 또한 최근 자연어 처리에서 높은 성능을 보이고 있는 사전학습 언어모델인 KoELECTRA를 적용한 제안 모델은 본 연구에서 정의한 범죄 도메인 개체명 실험 데이터의 9종의 메인 카테고리 분류에서 micro average(이하 micro avg) F1-score 99%, macro average(이하 macro avg) F1-score 96%의 성능을 보이고, 56종의 서브 카테고리 분류에서 micro avg F1-score 98%, macro avg F1-score 62%의 성능을 보인다. 제안한 모델을 통해 향후 개선 가능성과 활용 가능성의 관점에서 분석한다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국융합학회 | - |
dc.title | 사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식 | - |
dc.title.alternative | A Named Entity Recognition Model in Criminal Investigation Domain using Pretrained Language Model | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 임희석 | - |
dc.identifier.doi | 10.15207/JKCS.2022.13.02.013 | - |
dc.identifier.bibliographicCitation | 한국융합학회논문지, v.13, no.2, pp.13 - 20 | - |
dc.relation.isPartOf | 한국융합학회논문지 | - |
dc.citation.title | 한국융합학회논문지 | - |
dc.citation.volume | 13 | - |
dc.citation.number | 2 | - |
dc.citation.startPage | 13 | - |
dc.citation.endPage | 20 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002812797 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Crime Prevention | - |
dc.subject.keywordAuthor | Criminal Investigation | - |
dc.subject.keywordAuthor | Pretrained Language Model | - |
dc.subject.keywordAuthor | Crime Domain Text | - |
dc.subject.keywordAuthor | Named Entity Recognition | - |
dc.subject.keywordAuthor | KoELECTRA | - |
dc.subject.keywordAuthor | 범죄예방 | - |
dc.subject.keywordAuthor | 범죄수사 | - |
dc.subject.keywordAuthor | 사전학습 언어모델 | - |
dc.subject.keywordAuthor | 범죄 도메인 텍스트 | - |
dc.subject.keywordAuthor | 개체명 인식 | - |
dc.subject.keywordAuthor | KoELECTRA | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.