Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

목표 범주가 희귀한 자료의 과대표본추출에 대한 연구A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare

Other Titles
A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare
Authors
김은나이성건최종후
Issue Date
2011
Publisher
한국통계학회
Keywords
과대표본추출; 사후확률 조정; 희귀사건; 오프셋 방법; 가중치 방법; Over-sampling; adjusting of posterior probability; rare event offset method; weighted method.
Citation
응용통계연구, v.24, no.3, pp.477 - 484
Indexed
KCI
Journal Title
응용통계연구
Volume
24
Number
3
Start Page
477
End Page
484
URI
https://scholar.korea.ac.kr/handle/2021.sw.korea/114117
ISSN
1225-066X
Abstract
반응/미반응 목표변수를 갖는 모집단에서 관심 목표범주의 빈도가 극히 작을 경우, 즉 희귀할(rare) 경우, 모형 구축을 위한 데이터마트를 형성할 때 반응/미반응 범주 구성비는 구축된 모형의 성능에 영향을 준다. 본 연구는 이러한 점에 착안하여 반응/미반응 범주 구성비와 모형성능의 관련성을 모형평가 통계량에 기반하여 판단한다. 이로써 데이터마트 형성에 이상적인 반응/미반응 범주 구성비를 탐지하려는데 본 연구의 목적을 두고 있다. 또한 일반적으로 목표범주의 빈도가 희귀할 경우, 분할 표본추출에 의하여 희귀사건(rare event)을 과대표본추출(oversampling)하는 것이 일반적이며, 이로부터 기인하는 사후확률에 대한 편향을 조정하게 된다. 본 연구에서는 사후확률 조정방법으로 오프셋(offset) 방법과 가중치 방법(sampling weights)을 적용하고 이를 비교하였다.
Files in This Item
There are no files associated with this item.
Appears in
Collections
College of Public Policy > Division of Big Data Science > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Altmetrics

Total Views & Downloads

BROWSE