نوع مقاله : مقاله پژوهشی
نویسندگان
1 دانشجوی دکتری رشته سنجش و اندازه گیری، دانشگاه تهران، تهران، ایران.
2 دانشیار دانشگاه تهران، تهران، ایران
3 استادیار گروه برنامه ریزی درسی، دانشگاه خوارزمی، تهران، ایران
4 دانشیار دانشکده روان شناسی و علومتربیتی؛ دانشگاه تهران، تهران، ایران
5 استادیار سازمان سنجش آموزش کشور، تهران، ایران
چکیده
شاخص یودن یک معیار متداول برای منحنی ویژگی عملکرد (ROC) است که هم کارایی یک آزمون ملاکمرجع را میسنجد و هم مقدار نمره برش را برای آزمون مشخص میکند. این پژوهش با هدف مقایسه و ارزیابی سه روش برآورد ناپارامتری تجربی، هسته با روش پهنای باند سیلورمن و هسته با روش پهنای باند اعتبارسنجی متقابل ماکسیمم درستنمایی برای محاسبه مقدار شاخص یودن انجام شده است. در این پژوهش برای ارزیابی عملکرد از شاخصهای خطای استاندارد بوت استرپ (BSE)، ریشه میانگین مربعات خطا (RMSE)، مربع خطای یکپارچه (ISE) و میانگین مربعات خطای یکپارچه (MISE)استفاده شده است. نتایج نشان میدهد که روش هسته با اعتبارسنجی متقابل ماکسیمم درستنمایی دارای مقدار شاخص یودن بالاتری بود. نمرات برش به دست آمده برای روشهای هسته 479 و برای روش تجربی 465 به دست آمد. با توجه به نتایج قابل قبول شاخصهای ارزیابی، روشهای هسته بهویژه با پهنای باند بهینه اعتبارسنجی متقابل ماکسیمم درستنمایی منجر به برآوردهای قابل اعتمادتری از شاخص یودن و نمره برش برای آزمون تولیمو میشود.
کلیدواژهها
عنوان مقاله [English]
Comparing nonparametric methods for determining cut scores in criterion referenced tests by using Youden index subject of study: Tolimo test
نویسندگان [English]
- Maryam Parsaeian 1
- Ebrahim Khodaie 2
- Balal Izanloo 3
- Keyvan Salehi 4
- sima naghizadeh 5
1 universty of Tehran
2 Tehran University
3 Faculty of Psychology and Education, Kharazmi University, Tehran, Iran.
4 Associate professor, Division of Research and Assessment, Faculty of Psychology and Education, University of Tehran, Tehran, Iran
5 national organization for educational testing
چکیده [English]
The Youden index is a commonly used summary measure for the Receiver Operator Characteristic (ROC) curve that both measures the performance of a criterion-referenced test and specifies the cutoff score value for the test. This research aims to compare and evaluate three empirical non-parametric estimation methods, kernel with Silverman's bandwidth method and kernel with maximum likelihood cross-validation bandwidth method to calculate the value of Youden's index. In this research, bootstrap standard error (BSE), root mean square error (RMSE), square integrated error (ISE) and mean square integrated error (MISE) indices were used to evaluate the performance. The results show that the kernel method with maximum likelihood cross-validation had a higher Youden index value. The obtained cutoff scores were 479 for the kernel methods and 465 for the empirical method. According to the acceptable results of the evaluation indices, kernel methods especially with the optimal bandwidth of the maximum likelihood cross-validation lead to more reliable estimates of the Youden index and the cutoff score in Tolimo test results.
کلیدواژهها [English]
- cut scores
- Youden index
- nonparametric methods
- criterion referenced tests