Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

한글 마이크로블로그 텍스트의 감정 분류 및 분석Classification and Analysis of Emotion in Korean Microblog Texts

Other Titles
Classification and Analysis of Emotion in Korean Microblog Texts
Authors
이철성최동희김성순강재우
Issue Date
2013
Publisher
한국정보과학회
Keywords
감정분석; 영화장르분석; 기계학습; 베이즈 확률모델; emotion analysis; movie genre analysis; machine learning; bayes model
Citation
정보과학회논문지 : 데이타베이스, v.40, no.3, pp.159 - 167
Indexed
KCI
Journal Title
정보과학회논문지 : 데이타베이스
Volume
40
Number
3
Start Page
159
End Page
167
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/106348
ISSN
1229-7739
Abstract
지금까지 국내에서는 우리말을 이용하여 긍・부정을 판단하는 감성분석연구(sentiment analysis)가 주를 이뤘고, 여러 감정으로 분류하는 감정분석연구(emotion analysis)는 진행되지 않았다. 이에 본 연구에서는 한글 문서를 기반으로 기계학습 모델을 적용하여 7개의 감정으로 분류하고 그 결과를 영화평에 적용하여 영화 장르별 감정특성을 분석하였다. 본 연구에 적용한 기계학습 모델 중 ‘다항 네이브 베이즈(Multinomial Naive Bayes) 모델이 가장 높은 정확도를 보였다. 이 모델을 ‘네이버 40자 영화평’에 적용하여 영화 100편에 해당하는 영화평의 감정을 분류하고, 요인분석(factor analysis)하였다. 그 결과, ‘생동감’과 ‘우울’이 상반되는 감정임을 알 수 있었고, 영화평에 나타난 ‘친근감’은 영화의 평점에 긍정적인 영향을 미치고, ‘분노’, ‘혼란’, ‘피로감’은 부정적인 영향을 미치는 것으로 나타났다. 반면에 ‘생동감’과 ‘우울’은 영화의 평점에 영향을 미치지 않은 것으로 나타났다. 또한, 단일감정을 특성으로 하는 4개의 장르 즉, 공포-‘긴장감’, 코미디-‘생동감’, 멜로/애정/로맨스-‘친근감’, 범죄-‘혼란’이 영화 장르별 감정 특성으로 나타났다. 트위터(Twitter)로부터 수집한 데이터를 이용하여 ‘네이버 40자 영화평’에 적용한 이번 연구는 데이터의 성격을 넘어, 본 연구에서 제안한 방법이 실제 응용분야에서 적용 가능함을 보여준다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
Graduate School > Department of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Kang, Jae woo photo

Kang, Jae woo
컴퓨터학과
Read more

Altmetrics

Total Views & Downloads

BROWSE