이분형 목표변수의 분류 및 예측을 위한 최적모형의 탐지A Study on Exploration of the Recommend Model for Classification and Prediction for Binary Target
- Other Titles
- A Study on Exploration of the Recommend Model for Classification and Prediction for Binary Target
- Authors
- 김선경; 최종후
- Issue Date
- 2014
- Publisher
- 한국자료분석학회
- Keywords
- 의사결정나무; k-fold 교차타당법; CHAID; CART; QUEST; decision tree; k-fold cross validation; CHAID; CART; QUEST
- Citation
- Journal of The Korean Data Analysis Society, v.16, no.1, pp.115 - 124
- Indexed
- KCI
- Journal Title
- Journal of The Korean Data Analysis Society
- Volume
- 16
- Number
- 1
- Start Page
- 115
- End Page
- 124
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/100068
- ISSN
- 1229-2354
- Abstract
- 의사결정나무는 의사결정규칙을 나무구조로 도표화하여 분류 및 예측을 수행하는 분석이다. 이분형 목표변수의 분류 및 예측을 위하여 이용되는 의사결정나무모형은 직관적이며, 나무구조에 의해 분석 과정의 설명이 용이하기 때문에 탐색적 지식발견에 널리 활용된다. 본 연구는 의사결정나무의 다양한 경쟁모형 중에서 분류 및 예측을 위한 최적모형을 탐지하는데 그 목적을 두고 있다. 본 연구에서 적용된 의사결정나무 분리 알고리즘(splitting algorithm)은 CHAID, Exhaustive CHAID, CART, QUEST이다. 최적 모형의 탐지는 두 단계에 걸쳐 시도된다. 첫 단계는 네 가지 분류 알고리즘 각각에 대하여 상위, 하위 마디의 최소 개체수와 나무깊이를 달리하면서 각각의 분류 알고리즘 내에서 오분류율을 최소로 하는 모형을 선발한다. 이때 안정적인 결과를 얻기 위하여 10-fold 교차타당성(cross validation) 실험을 적용하였다. 두 번째 단계는 네 가지 분류 알고리즘 각각에서 후보모형으로 선발된 모형을 다시 이익값(gain)과 향상도(lift) 통계량에 기반하여 비교함으로써 최종적으로 최적모형을 선발한다. 실증분석을 위하여 목표변수가 이분형인 DM 반응 자료가 이용되었다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Public Policy > Division of Big Data Science > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.