Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한국어의 어순 구조를 고려한 Two-Path 언어모델링Two-Path Language Modeling Considering Word Order Structure of Korean

Other Titles
Two-Path Language Modeling Considering Word Order Structure of Korean
Authors
신중휘박재현이정태임해창
Issue Date
2008
Publisher
한국음향학회
Keywords
한국어; 언어모델링; 어순; 용언형태소; 세그먼트 단위; Korean; Language modeling; Verbal morpheme; Word order; Segment unit
Citation
한국음향학회지, v.27, no.8, pp.435 - 442
Indexed
KCI
Journal Title
한국음향학회지
Volume
27
Number
8
Start Page
435
End Page
442
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/125407
ISSN
1225-4428
Abstract
n-gram 모델은 영어와 같이 어순이 문법적으로 제약을 받는 언어에 적합하다. 그러나 어순이 비교적 자유로운 한국어에는 적합하지 않다. 기존 연구는 어절 간 어순의 고려가 어려운 한국어의 특성을 반영한 twoply HMM을 제안했으나, 인접 어절 간 어순 구조를 반영하지 못하였다. 본 논문에서는 용언형태소 사이에 나타나는 인접 어절 간에 어순 특성을 반영하기 위해 두 어절을 결합하는 세그먼트 단위를 정의하고, 제안한 세그먼트 단위에서 문맥에 따라 확률을 달리 추정하는 two-path 언어모델을 제안한다. 그 결과 기존 한국어 언어모델에 비해 제안하는 two-path 언어모델은 기존 연구보다 25.68% 혼잡도를 줄였으며, 어절 간에 결합이 일어나는 경계인 용언형태소에서는 94.03%의 혼잡도를 줄였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Informatics > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE