연속형과 범주형 변수가 혼합된 데이터의 군집분석 연구
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 한지수 | - |
dc.contributor.author | 조형준 | - |
dc.date.accessioned | 2021-09-02T20:10:57Z | - |
dc.date.available | 2021-09-02T20:10:57Z | - |
dc.date.created | 2021-06-17 | - |
dc.date.issued | 2018 | - |
dc.identifier.issn | 1229-2354 | - |
dc.identifier.uri | https://scholar.korea.ac.kr/handle/2021.sw.korea/80324 | - |
dc.description.abstract | 연속형 변수와 범주형 변수가 함께 존재하는 혼합형 데이터의 군집분석에서 연속형 변수의 경우에 유클리디안 거리처럼 자연스럽게 거리를 정의할 수 있지만, 범주형 변수, 특히 순서가 없는 명목형 변수의 경우에 개체 간 거리 측정이 모호하여 종종 배제되었다. 개체 간 거리를 기반으로 하는 군집분석 방법에서 개체 간 거리의 정의는 매우 핵심적인 문제이므로 명목형 변수의 합리적 정의는 신뢰할 수 있는 군집분석 위해서는 중요한 요소이다. 따라서 두 가지 형태의 변수가 함께 존재하는 경우에 범주형 변수의 거리 측정을 위해 모형화를 위해 종종 이용되는 가변수 변환 방법, 범주의 일치 여부에 따라 0-1로 거리를 부여하는 Gower의 방법, 그리고 변수의 수준 개수 정보를 활용하는 Eskin의 방법 도입하여 혼합형 데이터에 거리를 측정할 수 있도록 군집 분석 결과를 비교하였다. 거리 정의 방법에 의존하지 않는 공정한 비교를 위해 세 가지 평가 측도를 이용하였다. 그 결과, 군집의 퍼짐 정도 및 군집 별 개체의 불균형한 상황에서 Eskin의 방법의 성능이 우수하였다. 또한, 군집의 응집성, 재현성, 군집의 개수 정확도 측면에서 Eskin의 방법이 더 나은 성능을 보였다. | - |
dc.language | Korean | - |
dc.language.iso | ko | - |
dc.publisher | 한국자료분석학회 | - |
dc.title | 연속형과 범주형 변수가 혼합된 데이터의 군집분석 연구 | - |
dc.title.alternative | A Study on Cluster Analysis of Mixed Data with Continuous and Categorical Variables | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 조형준 | - |
dc.identifier.doi | 10.37727/jkdas.2018.20.4.1769 | - |
dc.identifier.bibliographicCitation | Journal of The Korean Data Analysis Society, v.20, no.4, pp.1769 - 1780 | - |
dc.relation.isPartOf | Journal of The Korean Data Analysis Society | - |
dc.citation.title | Journal of The Korean Data Analysis Society | - |
dc.citation.volume | 20 | - |
dc.citation.number | 4 | - |
dc.citation.startPage | 1769 | - |
dc.citation.endPage | 1780 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002380072 | - |
dc.description.journalClass | 2 | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | 명목형 변수 | - |
dc.subject.keywordAuthor | 혼합형 자료 | - |
dc.subject.keywordAuthor | 거리 측정 | - |
dc.subject.keywordAuthor | 계층적 군집분석. | - |
dc.subject.keywordAuthor | nominal variable | - |
dc.subject.keywordAuthor | mixed data | - |
dc.subject.keywordAuthor | distance measure | - |
dc.subject.keywordAuthor | hierarchical clustering. | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
(02841) 서울특별시 성북구 안암로 14502-3290-1114
COPYRIGHT © 2021 Korea University. All Rights Reserved.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.