초록 close

이 연구는 단위학교에서 총괄평가로 진행된 체육 지필평가를 고전검사이론과 문항반응이론의 3모수 로지스틱 모형을 적용하여 검사의 앙호도 및 차별기능문항을 탐색하고, 체육수업 개선의 정보를 얻는 것이 목적이다. 문항반응이론은 검사이론으로서 고전검사이론에 비해 다양한 장점이 인정되어 왔으나, 이론의 난해함과 적용에 요구되는 엄격한 기준으로 인해 학교 현장에서는 사용되지 않았다. 그러나 최근 학교 체육분야에서 여학생체육활성화가 이슈가 되면서, 차별기능문항의 개념이 주목받으면서 동시에 문항반응이론에 관심이 늘고 있다. 따라서 본 연구는 고등학교 1학년 학생 270명을 대상으로 시행한 단위학교 체육 지필평가 검사자료를 사용하여 내용 타당도, 신뢰도, 난이도, 변별도 및 검사정보함수를 살펴보고, 성별에 따라 다르게 기능하는 차별기능문항을 탐색하였다. 그 결과, 내용 타당도는 80%, 고전검사이론에 의한 신뢰도(Cronbach'a)는 0.736, 문항반응이론에 의한 신뢰도(marginal reliability)는 0.770으로 나타나, 비교적 양호한 검사인 것으로 판단되었다. 문항분석 결과 고전검사이론과 문항반응이론 모두에서 17, 22, 24, 25번 문항은 양호하지 않은 문항인 것으로 나타났다. 검사정보함수 분석 결과 피검자의 능력수준이 –2에서 0 사이일 때 가장 높은 검사정보를 제공하며, 남녀 집단간 차이가 존재하였다. MH방법과 문항반응이론의 문항특성곡선으로 차별기능문항을 탐색한 결과, 5, 11번 문항이 성별에 차별적으로 기능하고 있음을 확인하였고, 논의에서 성차별적인 교수학습과정이 그 원인임을 질적 분석을 통해 확인하였다. 결론적으로 본 연구는 문항반응이론의 엄격한 조건을 충족하지 않는 학교현장의 자료라 할지라도, 현장 교사들에게 고전검사이론과 함께 문항반응이론에 의한 문항 양호도 검증이 한층 다양하고 유용한 정보를 제공할 수 있음을 보여주고 있으며, 특별히 차별기능문항 분석을 통한 성차별적인 교수학습과정의 확인과 반성은 여학생체육활성화를 위한 체육수업 개선에 중요한 정보가 될 수 있음을 확인하였다.


The purpose of this study was to examine goodness of pencil and paper(P&P) test as a general evaluation in Physical Education(PE) applying classical test theory(CTT) and three-parameter logistic(3PL) model in item response theory(IRT). Participants completed P&P test in PE were 10th high school students(N=270). Using test scores, content validity, reliability, item difficulty, discrimination and test information function were examined. And differentially functioning item by the population difference between male and female were explored. Results showed that content validity was 80%, reliability coefficient was 0.736, and IRT's marginal reliability was 0.770. In both CTT and IRT, item number 17, 22, 24, 25 were not appropriate in terms of the discrimination power. Test information function indicated that examinees with ability level between -2 and 0 showed best score. Also, test information and Mantel-Haenszel method identified differentially functioning item (i.e., item number 5 and 11) indicating two items are in favor of male students. Generally, IRT provided a wider range of information than CTT, including test information and DIF using item characteristic curve. Discussions were provided in terms of the CTT using in schools traditionally and IRT for verification of goodness. And to conclude, this study is related with goodness applying CTT and IRT show lesson improvement and facilitating female student’s participation are helpful in PE.