초록 close

결측값 대한 처리방법은 매우 활발하게 연구되어 왔음에도 불구하고, 그것이 판별분석에 미치는 영향에 대한 연구는 충분치 않았다. 본 논문에서는 결측값에 대한 처리 방법이 정준판별분석에 미치는 영향과 결측 자료로부터 구한 정준판별계수의 통계적 추론에 대해 다루었다. 결측 자료에 평균대치법, 회귀대치법, 최근접이웃대치법, 다중대치법을 적용하여 결측값을 대치시킨 후 정준판별분석을 실시한 결과를 비교하였으며, 나아가 붓스트랩 방법을 이용하여 판별계수의 표본분포를 추정하고 이를 판별계수에 대한 신뢰구간 구축과 가설 검정에 활용해 보았다. 또한 모의실험을 통하여 판별계수에 대한 통계적 추론에 있어서 붓스트랩 방법의 유용성을 확인하였다.


Although many researchers have been studied with missing data in applied statistics for several decades, discriminant analysis has not been their interest. In this article, we examined the effect of imputation methods which are one of the most usual treatments on missing data, especially in canonical discriminant analysis and also deal with statistical inference of canonical discriminant coefficients from missing data. We performed a canonical discriminant analysis with missing-imputed data and compared the results of the four imputation methods, which are mean imputation, regression imputation, k-nearest neighbor imputation, and multiple imputation using EM algorithm. Furthermore we estimated the sampling distribution of coefficients by the bootstrap method in order to apply it for statistical inference.