소설 코퍼스를 활용한 ‘서동산’의 소설 『염마』의 저자 판별Authorship Attribution of YeomMa , the Novel Under the Pseudonym Seo Dong-san, by Applying Novel Corpus
- Other Titles
- Authorship Attribution of YeomMa , the Novel Under the Pseudonym Seo Dong-san, by Applying Novel Corpus
- Authors
- 문한별; 이도길
- Issue Date
- 2019
- Publisher
- 중앙어문학회
- Keywords
- 코퍼스; 전산문체론; 저자 판별; 형태소 분석기; 서동산; 채만식; 『염마』; Corpus; computerized stylistics; authorship attribution discrimination; morpheme analyzer; Seo Dong-san; Chae Man-sik; YeomMa
- Citation
- 어문론집, v.78, pp.63 - 91
- Indexed
- KCI
- Journal Title
- 어문론집
- Volume
- 78
- Start Page
- 63
- End Page
- 91
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/69426
- DOI
- 10.15565/jll.2019.06.78.63
- ISSN
- 1229-6406
- Abstract
- 본 연구는 소설 코퍼스(corpus)를 활용하여 필명 ‘서동산(Seo Dong San)’ 의 작품 『염마』(1934)가 어떤 작가의 것인지를 판별하는 것을 목표로 하였다. 대규모 코퍼스를 활용한 문학 연구는 크게 두 가지 방향으로 진행할 수 있는데, 그 하나는 작가의 문체적 특질을 코퍼스를 바탕으로 하여 계량적으로 접근하 여 유형화하는 전산문체론이며, 다른 하나는 저자가 불분명한 작품을 계량적 으로 환산하여 기계학습법이나 유사도를 통해 확인하는 저자 판별론이다. 본 연구는 근현대 소설 작가 14명의 작품 70편을 코퍼스로 구축하고 이를 형태소 분석기를 통하여 어휘를 추출한 후 자질 실험을 통해 유사도를 측정하여 작가 판별을 시도하였다. 유사도 기반의 접근법을 통한 저자 판별의 핵심은 동일한 저자의 텍스트들은 다른 저자의 텍스트보다 문체적으로 더 유사할 것이라는 가정을 바탕으로 한다. 본 연구는 ‘서동산’의 소설 『염마』를 저자가 확실한 14 명의 다른 작품들과 비교함으로써 가장 유사한 텍스트를 확인하고자 하였다. 그 결과 같은 해에 창작 발표된 채만식(Chae Man Sik)의 「레디메이드 인생」이 유사도 1위로 확인되었다. 이 같은 연구 방법론은 향후 필명만 확인되거나 작 자 미상의 작품들을 판별하는 데에 적극적으로 활용할 수 있을 것으로 기대 한다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Associate Research Center > Research Institute of Korean Studies > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.