목표 범주가 희귀한 자료의 과대표본추출에 대한 연구A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare
- Other Titles
- A Study on the Adjustment of Posterior Probability for Oversampling when the Target is Rare
- Authors
- 김은나; 이성건; 최종후
- Issue Date
- 2011
- Publisher
- 한국통계학회
- Keywords
- 과대표본추출; 사후확률 조정; 희귀사건; 오프셋 방법; 가중치 방법; Over-sampling; adjusting of posterior probability; rare event offset method; weighted method.
- Citation
- 응용통계연구, v.24, no.3, pp.477 - 484
- Indexed
- KCI
- Journal Title
- 응용통계연구
- Volume
- 24
- Number
- 3
- Start Page
- 477
- End Page
- 484
- URI
- https://scholar.korea.ac.kr/handle/2021.sw.korea/114117
- ISSN
- 1225-066X
- Abstract
- 반응/미반응 목표변수를 갖는 모집단에서 관심 목표범주의 빈도가 극히 작을 경우, 즉 희귀할(rare) 경우, 모형 구축을 위한 데이터마트를 형성할 때 반응/미반응 범주 구성비는 구축된 모형의 성능에 영향을 준다. 본 연구는 이러한 점에 착안하여 반응/미반응 범주 구성비와 모형성능의 관련성을 모형평가 통계량에 기반하여 판단한다. 이로써 데이터마트 형성에 이상적인 반응/미반응 범주 구성비를 탐지하려는데 본 연구의 목적을 두고 있다. 또한 일반적으로 목표범주의 빈도가 희귀할 경우, 분할 표본추출에 의하여 희귀사건(rare event)을 과대표본추출(oversampling)하는 것이 일반적이며, 이로부터 기인하는 사후확률에 대한 편향을 조정하게 된다. 본 연구에서는 사후확률 조정방법으로 오프셋(offset) 방법과 가중치 방법(sampling weights)을 적용하고 이를 비교하였다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - College of Public Policy > Division of Big Data Science > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.