빈도 정보를 이용한 한국어 저자 판별Authorship Attribution in Korean Using Frequency Profiles
- Other Titles
- Authorship Attribution in Korean Using Frequency Profiles
- Authors
- 한나래
- Issue Date
- 2009
- Publisher
- 한국인지과학회
- Keywords
- authorship attribution; Korean; computational stylistics; morpheme frequency; 저자 판별; 전산 문체론; 정량적 문체론; 형태소 빈도
- Citation
- 인지과학, v.20, no.2, pp.225 - 241
- Indexed
- KCI
- Journal Title
- 인지과학
- Volume
- 20
- Number
- 2
- Start Page
- 225
- End Page
- 241
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/121642
- DOI
- 10.19066/cogsci.2009.20.2.006
- ISSN
- 1226-4067
- Abstract
- 본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Associate Research Center > Research Institute of Korean Studies > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.