Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

빈도 정보를 이용한 한국어 저자 판별Authorship Attribution in Korean Using Frequency Profiles

Other Titles
Authorship Attribution in Korean Using Frequency Profiles
Authors
한나래
Issue Date
2009
Publisher
한국인지과학회
Keywords
authorship attribution; Korean; computational stylistics; morpheme frequency; 저자 판별; 전산 문체론; 정량적 문체론; 형태소 빈도
Citation
인지과학, v.20, no.2, pp.225 - 241
Indexed
KCI
Journal Title
인지과학
Volume
20
Number
2
Start Page
225
End Page
241
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/121642
DOI
10.19066/cogsci.2009.20.2.006
ISSN
1226-4067
Abstract
본고에서는 빈도 정보를 이용한 저자 판별 (authorship attribution) 기법을 한국어에 적용한 연구를 소개한다. 그 대상으로는 정형화된 장르인 신문 칼럼을, 구체적으로는 조선일보에 연재 중인 4인 칼럼니스트들의 각 40개 칼럼, 총 160개 칼럼 텍스트를 선정하였다. 이들에 대하여 어절, 음절, 형태소, 각 단위 2연쇄 등의 다양한 언어 단위들의 빈도 정보들을 이용한 저자 판별을 시도한 결과, 형태소 빈도를 기반으로 하여 최고 93%를 넘는 높은 예측 정확도를 얻을 수 있었다. 또한, 저자 개인 문체간의 거리도 빈도 정보로써 계량적 표상이 가능함을 보일 수 있었다. 이로써 빈도 분석과 같은 통계적, 계량적 방법을 통하여 한국어 텍스트에 대한 성공적인 저자 판별과 개인 문체의 정량화가 가능하다는 결론을 내릴 수 있다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
Associate Research Center > Research Institute of Korean Studies > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE