Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

전통문화 콘텐츠 표준체계를 활용한 자동 텍스트 분류 시스템A System for Automatic Classification of Traditional Culture Texts

Other Titles
A System for Automatic Classification of Traditional Culture Texts
Authors
허윤아이동엽김규경유원희임희석
Issue Date
2017
Publisher
한국융합학회
Keywords
텍스트 분류; 빅데이터; 지도 학습; 기계학습; 자연어처리; Text Classification; Big Data; Supervised Learning; Machine Learning; Natural Language Processing
Citation
한국융합학회논문지, v.8, no.12, pp.39 - 47
Indexed
KCI
Journal Title
한국융합학회논문지
Volume
8
Number
12
Start Page
39
End Page
47
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/85425
DOI
10.15207/JKCS.2017.8.12.039
ISSN
2233-4890
Abstract
한국 문화의 역사, 전통과 관련된 디지털 웹 문서가 증가하게 되었다. 하지만 창작자 또는 전통 문화와 관련된 소재를 찾는 사용자들은 정보를 검색해도 결과가 충분하지 않았으며 원하는 정보를 얻지 못하는 경우가 나타나고 있다. 이런 효과적인 정보를 접하기 위해서는 문서 분류가 필요하다. 과거에 문서 분류는 작업자가 수작업으로 문서 분류하여 시간과 비용이 많이 소비하는 어려움이 있었지만, 최근 기계학습 기반으로 한 자동 문서 분류를 통해 효율적인 문서 분류가 이루어진다. 이에 본 논문은 전통문화 콘텐츠를 체계적인 분류체계로 구성한 한민족정보문화마당 데이터를 기반으로 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발한다. 본 연구는 한민족정보문화마당 텍스트 데이터에 대해 단어 빈도수를 추출하기 위해 TF-IDF모델, Bag-of-Words 모델, TF-IDF/Bag-of-Words를 결합한 모델을 적용하여 각각 SVM 분류 알고리즘을 사용하여 전통문화 콘텐츠 자동 텍스트 분류 모델을 개발하여 성능평가를 확인하였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
Graduate School > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE