Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

결측자료 분석에서 결측 비율이 결측자료 k-평균 군집분석에 미치는 영향The Effect of Nonresponse Rates on K-Means Cluster Analysis with Missing Data

Other Titles
The Effect of Nonresponse Rates on K-Means Cluster Analysis with Missing Data
Authors
송주원
Issue Date
2017
Publisher
한국자료분석학회
Keywords
결측자료; 결측비율; k-평균; 군집분석; 대체.; missing data; nonresponse rate; k-means; cluster analysis; imputation.
Citation
Journal of The Korean Data Analysis Society, v.19, no.3, pp.1273 - 1282
Indexed
KCI
Journal Title
Journal of The Korean Data Analysis Society
Volume
19
Number
3
Start Page
1273
End Page
1282
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/85877
DOI
10.37727/jkdas.2017.19.3.1273
ISSN
1229-2354
Abstract
결측자료의 분석에서 결측 비율은 분석의 질에 영향을 주는 주요 요소로 생각되어 왔다. 최근 결측 비율이 추정량의 편향에 영향을 주지 않는다는 연구 결과들이 발표되면서 결측 비율이 향상 분석의 질을 감소시키는 것은 아니라는 주장이 힘을 싣고 있다. 하지만 관련 연구들은 조사 자료에서 결측이 발생한 경우 모집단 평균을 추정하는데 결측 비율이 영향을 주는지를 논의하고 있으며 다른 분석에서의 영향을 평가한 연구는 찾기 힘들다. 군집분석은 자료 내 유사한 특성을 지닌 개체들을 동일한 군집으로 분류하는 분석기법으로 군집의 평균 추정보다는 적절한 분류를 실시하지 못하는 정도에 중점을 두고 분석이 실시되므로 조사 연구에서 모평균 추정과는 다른 문제로 접근하는 것이 필요하다. 본 연구에서는 군집분석 기법 중 하나인 k-평균 군집분석에 대하여 대체를 실시한 후 k-평균 군집분석을 시행할 때 결측 비율이 어떤 영향을 미치는 지 고찰하였다. 특히 k-평균 군집분석의 성능 및 결측자료의 성능과 연관된 요인들인 군집 간 분포의 겹침 정도, 결측자료 메커니즘, 그리고, 결측자료 대체 방법에 따라 결측 비율이 증가할 때 군집분석의 오분류율이 증가하는지 모의실험을 통해 평가하였다. 군집 간 분포의 겹침 정도가 적은 경우 결측비율이 증가해도 오분류율은 비례적으로 증가하지 않는 것으로 나타났다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Political Science & Economics > Department of Statistics > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher SONG, Ju won photo

SONG, Ju won
College of Political Science & Economics (Department of Statistics)
Read more

Altmetrics

Total Views & Downloads

BROWSE