초록 close

본 연구에서는 보험청구자료를 이용하여 기상 조건과 관련성이 높은 것으로 추정되는 질병 가운데 비교적 발생규모와 대중적인 관심도가 높다고 판단되는 피부질환에 대한 환자 발생 예측 모형을 개발하고 이들의 효용성을 보이고자 한다. 회귀모형과 LS-SVM(least square-support vector machine)을 이용해 기상조건에 따른 표준화된 일일발생환자수를 추정하였다. 발생환자수를 각각 경고, 주의 그리고 보통으로 분류 변환 후 훈련용 자료와 검정용 자료에 대하여 오분류표를 구하였다. 또한 표준화된 일일 발생환자수에 logistic 회귀모형을 적합 시킨 후 오분류표를 구하였다. 회귀모형과 LS-SVM 및 logistic 회귀모형을 통하여 분석한 결과 훈련용 자료와 검정용 자료에서 정분류율이 각각, 72.8%, 70.6%와 72.5%, 67.7% 및 75.3%, 70.6%로 나타났다. 이 결과를 토대로 최종분석모형으로 logistic 회귀모형을 선택하여 적합한 결과 유의확률이 아주 유의하게 나왔으며 평균상대습도가 높을수록 그리고 영하의 날씨 지속일수가 많을수록 경고가능성이 높아짐을 알 수 있었다.


In this study, using the hourly meteorological data and the medical treatment records from Health Insurance Review Agency in Korea, we developed the predictable statistical model for the weather-related cutaneousdisorder, such as, L50.9, L29.9, L98.1,and L98.9(International Classification of Disease, 10th version) and showed the utility of this model. Using the method of regression and LS-SVM, we estimated the number of standardized daily patient. The upper 15%, the following upper 35% and the remaining were classified into a warning level, an advisory level and a usual level respectively. And we also fitted the logistic regression model. The correct classification degrees through three methods of regression, LS-SVM and logistic regression in test data and validation data are 72.8%, 70.6%, 72.5%, 67.7% and 75.3%, 70.6% respectively. Finally we selected logistic regression model as our final one. The result showed that p-value was very small. And as the relative humidity and the number of duration day below zero temperature increases, the probability of a warning level increases.