Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

계수 자료 분석을 위한 의사결정나무에서의 변수선택Variable Selection in Decision Tree for Count Data

Other Titles
Variable Selection in Decision Tree for Count Data
Authors
이석형조형준
Issue Date
2012
Publisher
한국자료분석학회
Keywords
계수형자료; 데이터마이닝; 의사결정나무; CART.; Count data; Data mining; Decision tree; CART.
Citation
Journal of The Korean Data Analysis Society, v.14, no.1, pp.101 - 116
Indexed
KCI
Journal Title
Journal of The Korean Data Analysis Society
Volume
14
Number
1
Start Page
101
End Page
116
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/109772
ISSN
1229-2354
Abstract
의사결정나무는 데이터마이닝에서 사용되는 대표적인 방법으로 모형의 결과가 도식적으로 표현되어 해석과 예측이 쉬운 장점이 있다. 의사결정나무는 대부분 반응변수의 형태가 연속형 또는 범주형 중에 이항 또는 다항일 때 흔히 사용되었다. 또한, 대부분 알고리즘은 CART처럼 전체탐색 방법을 이용하여 분리 변수를 선택하기 때문에 계산 시간이 많이 소요되고, 분류 가능 경우의 수가 많은 변수를 선호하는 경향이 있다. 본 논문에서는 반응변수가 계수인 경우에 의사결정나무 알고리즘을 제안한다. 계수형 자료에 적합한 포아송 모형과 과분산 문제가 있을 경우에 적합한 음이항 모형을 기본으로 이용하고, 잔차 분석을 통한 빠르고 부당한 선호 현상이 없는 분류 선택 방법을 제안한다. 본 논문에서 전체탐색 방법의 문제점과 우리가 제안한 방법의 우수성을 모의실험을 통해 검증한다. 마지막으로 실제 자료를 이용하여 실용성을 보인다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Political Science & Economics > Department of Statistics > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher CHO, HYUNG JUN photo

CHO, HYUNG JUN
College of Political Science & Economics (Department of Statistics)
Read more

Altmetrics

Total Views & Downloads

BROWSE