Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식

Full metadata record
DC Field Value Language
dc.contributor.author김희두-
dc.contributor.author임희석-
dc.date.accessioned2022-05-17T15:41:46Z-
dc.date.available2022-05-17T15:41:46Z-
dc.date.created2022-05-17-
dc.date.issued2022-
dc.identifier.issn2233-4890-
dc.identifier.urihttps://scholar.korea.ac.kr/handle/2021.sw.korea/141140-
dc.description.abstract본 연구는 딥러닝 기법을 활용하여 범죄 수사 도메인에 특화된 개체명 인식 모델을 개발하는 연구이다. 본 연구를 통해 비정형의 형사 판결문·수사 문서와 같은 텍스트 기반의 데이터에서 자동으로 범죄 수법과 범죄 관련 정보를 추출하고 유형화하여, 향후 데이터 분석기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있는 시스템을 제안한다. 본 연구에서는 범죄 수사 도메인 텍스트를 수집하고 범죄 분석의 관점에서 필요한 개체명 분류를 새로 정의하였다. 또한 최근 자연어 처리에서 높은 성능을 보이고 있는 사전학습 언어모델인 KoELECTRA를 적용한 제안 모델은 본 연구에서 정의한 범죄 도메인 개체명 실험 데이터의 9종의 메인 카테고리 분류에서 micro average(이하 micro avg) F1-score 99%, macro average(이하 macro avg) F1-score 96%의 성능을 보이고, 56종의 서브 카테고리 분류에서 micro avg F1-score 98%, macro avg F1-score 62%의 성능을 보인다. 제안한 모델을 통해 향후 개선 가능성과 활용 가능성의 관점에서 분석한다.-
dc.languageKorean-
dc.language.isoko-
dc.publisher한국융합학회-
dc.title사전학습 언어모델을 활용한 범죄수사 도메인 개체명 인식-
dc.title.alternativeA Named Entity Recognition Model in Criminal Investigation Domain using Pretrained Language Model-
dc.typeArticle-
dc.contributor.affiliatedAuthor임희석-
dc.identifier.doi10.15207/JKCS.2022.13.02.013-
dc.identifier.bibliographicCitation한국융합학회논문지, v.13, no.2, pp.13 - 20-
dc.relation.isPartOf한국융합학회논문지-
dc.citation.title한국융합학회논문지-
dc.citation.volume13-
dc.citation.number2-
dc.citation.startPage13-
dc.citation.endPage20-
dc.type.rimsART-
dc.identifier.kciidART002812797-
dc.description.journalClass2-
dc.description.journalRegisteredClasskci-
dc.subject.keywordAuthorCrime Prevention-
dc.subject.keywordAuthorCriminal Investigation-
dc.subject.keywordAuthorPretrained Language Model-
dc.subject.keywordAuthorCrime Domain Text-
dc.subject.keywordAuthorNamed Entity Recognition-
dc.subject.keywordAuthorKoELECTRA-
dc.subject.keywordAuthor범죄예방-
dc.subject.keywordAuthor범죄수사-
dc.subject.keywordAuthor사전학습 언어모델-
dc.subject.keywordAuthor범죄 도메인 텍스트-
dc.subject.keywordAuthor개체명 인식-
dc.subject.keywordAuthorKoELECTRA-
Files in This Item
There are no files associated with this item.
Appears in
Collections
Graduate School > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE