한국 전통문화 말뭉치구축 및 Bi-LSTM-CNN-CRF를 활용한 전통문화 개체명 인식 모델 개발Constructing for Korean Traditional culture Corpus and Development of Named Entity Recognition Model using Bi-LSTM-CNN-CRFs
- Other Titles
- Constructing for Korean Traditional culture Corpus and Development of Named Entity Recognition Model using Bi-LSTM-CNN-CRFs
- Authors
- 김경민; 김규경; 조재춘; 임희석
- Issue Date
- 2018
- Publisher
- 한국융합학회
- Keywords
- 개체명 인식; 전통문화; 말뭉치; 딥러닝; 자질 보강; Named Entity Recognition; Traditional culture; Corpus; Deep Learning; feature augmentation
- Citation
- 한국융합학회논문지, v.9, no.12, pp.47 - 52
- Indexed
- KCI
- Journal Title
- 한국융합학회논문지
- Volume
- 9
- Number
- 12
- Start Page
- 47
- End Page
- 52
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/79747
- DOI
- 10.15207/JKCS.2018.9.12.047
- ISSN
- 2233-4890
- Abstract
- 개체명 인식(Named Entity Recognition)시스템은 문서로부터 고유한 의미를 가질 수 있는 인명(PS), 지명(LC), 기관명(OG) 등의 개체명을 추출하고 추출된 개체명의 범주를 결정하는 시스템이다. 최근 딥러닝 방식을 이용한 개체명 인식 연구에서 입력 데이터의 앞, 뒤 방향을 고려한 LSTM 기반의 Bi-LSTM 모델로부터 출력 데이터 간의 전이 확률을 이용한 CRF를 결합한 방식의 Bi-LSTM-CRF가 우수한 성능을 보이고, 문자 및 단어 단위의 효율적인 임베딩 벡터생성에 관한 연구와 CNN, LSTM을 활용한 모델에서도 좋은 성능을 보여주고 있다. 본 연구에서는 한국어 개체명 인식시스템 성능 향상을 위해 자질을 보강한 Bi-LSTM-CNN-CRF 모델에 관해 기술하고 전통문화 말뭉치구축 방식에 대해 제안한다. 그리고 구축한 말뭉치를 한국어 개체명 인식 성능 향상을 위한 자질 보강 모델 Bi-LSTM-CNN-CRF로 학습한 결과에 대해 제안한다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.