한국어의 어순 구조를 고려한 Two-Path 언어모델링Two-Path Language Modeling Considering Word Order Structure of Korean
- Other Titles
- Two-Path Language Modeling Considering Word Order Structure of Korean
- Authors
- 신중휘; 박재현; 이정태; 임해창
- Issue Date
- 2008
- Publisher
- 한국음향학회
- Keywords
- 한국어; 언어모델링; 어순; 용언형태소; 세그먼트 단위; Korean; Language modeling; Verbal morpheme; Word order; Segment unit
- Citation
- 한국음향학회지, v.27, no.8, pp.435 - 442
- Indexed
- KCI
- Journal Title
- 한국음향학회지
- Volume
- 27
- Number
- 8
- Start Page
- 435
- End Page
- 442
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/125407
- ISSN
- 1225-4428
- Abstract
- n-gram 모델은 영어와 같이 어순이 문법적으로 제약을 받는 언어에 적합하다. 그러나 어순이 비교적 자유로운 한국어에는
적합하지 않다. 기존 연구는 어절 간 어순의 고려가 어려운 한국어의 특성을 반영한 twoply HMM을 제안했으나, 인접
어절 간 어순 구조를 반영하지 못하였다. 본 논문에서는 용언형태소 사이에 나타나는 인접 어절 간에 어순 특성을 반영하기
위해 두 어절을 결합하는 세그먼트 단위를 정의하고, 제안한 세그먼트 단위에서 문맥에 따라 확률을 달리 추정하는
two-path 언어모델을 제안한다. 그 결과 기존 한국어 언어모델에 비해 제안하는 two-path 언어모델은 기존 연구보다
25.68% 혼잡도를 줄였으며, 어절 간에 결합이 일어나는 경계인 용언형태소에서는 94.03%의 혼잡도를 줄였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Informatics > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.