분류 분석을 위한 명목형 예측변수 변환 방법Transformation of Nominal Variables for Classification Analysis
- Other Titles
- Transformation of Nominal Variables for Classification Analysis
- Authors
- 조형준; 김지우
- Issue Date
- 2021
- Publisher
- 한국자료분석학회
- Keywords
- classification analysis; continuous predictor variable; dummy variable transformation; nominal predictor variable; 가변수 변환; 명목형 예측변수; 분류 분석; 연속형 예측변수
- Citation
- Journal of The Korean Data Analysis Society, v.23, no.4, pp.1569 - 1579
- Indexed
- KCI
- Journal Title
- Journal of The Korean Data Analysis Society
- Volume
- 23
- Number
- 4
- Start Page
- 1569
- End Page
- 1579
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/137900
- DOI
- 10.37727/jkdas.2021.23.4.1569
- ISSN
- 1229-2354
- Abstract
- 로지스틱회귀모형, 선형판별분류분석, 의사결정나무, 지지벡터기계 같은 다양한 방법으로 수행할 수 있는 분류 분석은 반응변수와 예측변수의 정보를 이용하여 개체를 특정 집단으로 분류하는 것이다. 일반적으로 분류 분석의 모형 추정은 예측변수가 연속형일 때 주로 정의 되어져 있다. 명목형 예측변수를 이용하기 위해 가변수 변환 후에 사용하고 있지만, 이는 반응변수 또는 명목형 예측변수의 범주가 많은 경우에 차원의 기하급수적 증가로 인하여 필요 모수 추정이 불안하여 비정칙 같은 문제점이 종종 발생한다. 적용 가능한 예측변수가 많아지고 다양해지면서 가변수 변환을 적용할 수 없는 경우도 발생한다. 따라서, 분류 분석에서 명목형 예측변수를 효과적으로 사용하기 위해 다른 변환 방법이 필요하다. 대안으로 반응변수의 정보를 반영하여 명목형 범주에 순서를 적절히 부여하는 CRIMCOORD 변환 방법을 소개한다. 이를 분류 분석에서 예측력을 가변수 변환과 비교 분석한다. 실제 자료를 훈령용와 검증용으로 분할하여 분류 분석 방법을 적용한 비교 실험 결과, CRIMCOORD 변환은 가변수 변환의 문제점을 보완해 주었다. 정보의 일부 손실에도 불구하고 손실을 최소하는 변환으로 분류 분석에서 예측력이 감소하지 않는 결과를 얻었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Political Science & Economics > Department of Statistics > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.