딥러닝 기반 한국어 맞춤법 교정을 위한 오류 유형 분류 및 분석Classification and analysis of error types for deep learning-based Korean spelling correction
- Other Titles
- Classification and analysis of error types for deep learning-based Korean spelling correction
- Authors
- 구선민; 박찬준; 소아람; 임희석
- Issue Date
- 2021
- Publisher
- 한국융합학회
- Keywords
- Artificial neural network machine translation; Error analysis; Korean spelling correction; Machine translation; Natural language processing; 기계 번역; 오류 분석; 인공신경망 기계번역; 자연어처리; 한국어 맞춤법 교정
- Citation
- 한국융합학회논문지, v.12, no.12, pp.65 - 74
- Indexed
- KCI
- Journal Title
- 한국융합학회논문지
- Volume
- 12
- Number
- 12
- Start Page
- 65
- End Page
- 74
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/138537
- DOI
- 10.15207/JKCS.2021.12.12.065
- ISSN
- 2233-4890
- Abstract
- 최근 기계 번역 기술과 자동 노이즈 생성 방법론을 기반으로 한국어 맞춤법 교정 연구가 활발히 이루어지고 있다. 해당 방법론들은 노이즈를 생성하여 학습 셋과 데이터 셋으로 사용한다. 이는 학습에 사용된 노이즈 외의 노이즈가 테스트 셋에 포함될 가능성이 낮아 정확한 성능 측정이 어렵다는 한계점이 존재한다. 또한 실제적인 오류 유형 분류 기준이 없어 연구마다 사용하는 오류 유형이 다르므로 질적 분석에 어려움을 겪고 있다. 이를 해결하기 위해 본 논문은 딥러닝 기반 한국어 맞춤법 교정 연구를 위한 새로운 ’오류 유형 분류 체계‘를 제안하며 이를 바탕으로 기존 상용화 한국어 맞춤법 교정기(시스템 A, 시스템 B, 시스템 C)에 대한 오류 분석을 수행하였다. 분석결과, 세 가지 교정 시스템들이 띄어쓰기 오류 외에 본 논문에서 제시한 다른 오류 유형은 교정을 잘 수행하지 못했으며 어순 오류나 시제 오류의 경우 오류 인식을 거의 하지 못함을 알 수 있었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.