한국어 문장 표절 유형을 고려한 유사 문장 판별A Detection Method of Similar Sentences Considering Plagiarism Patterns of Korean Sentence
- Other Titles
- A Detection Method of Similar Sentences Considering Plagiarism Patterns of Korean Sentence
- Authors
- 지혜성; 임희석; 조준희
- Issue Date
- 2010
- Publisher
- 한국컴퓨터교육학회
- Keywords
- plagiarism; similar sentence; N-gram model; LSA model; 표절; 유사 문장; N-gram 모델; LSA 모델
- Citation
- 컴퓨터교육학회 논문지, v.13, no.6, pp.79 - 89
- Indexed
- KCI
- Journal Title
- 컴퓨터교육학회 논문지
- Volume
- 13
- Number
- 6
- Start Page
- 79
- End Page
- 89
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/118078
- DOI
- 10.32431/kace.2010.13.6.008
- ISSN
- 1598-5016
- Abstract
- 본 논문은 한국어 표절 검사를 위해서 표절의 유형을 분석하여, 유형별 분석 결과를 기반으로 하여 유사 문장 판별 모델을 제안한다. 제안하는 방법은 한국어 문장에 대한 표절 유형 분석 결과를 토대로 LSA와 N-gram을 이용한 유사 문장 검색을 통하여 여러 유형의 표절로부터 견고한 유사 문장 판별 모델을 구현하였다. 제안한 모델의 성능 분석을 위해서 학생들이 인위적으로 작성한 표절 리포트와 표절한 첨부 문서로 실험 데이터를 구축하였다. 성능 비교를 위해서는 기존의 N-gram 모델, 벡터모델, LSA 모델이 사용되었으며, 실험 결과 제안한 모델이 정확률, 재현율, 그리고 F값 척도에서 우수한 성능을 보임을 알 수 있었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - Graduate School > Department of Computer Science and Engineering > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.