<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE ArticleSet PUBLIC "-//NLM//DTD PubMed 2.7//EN" "https://dtd.nlm.nih.gov/ncbi/pubmed/in/PubMed.dtd">
<ArticleSet>
<Article>
<Journal>
				<PublisherName>دانشگاه علامه طباطبائی</PublisherName>
				<JournalTitle>فصلنامه اندازه گیری تربیتی</JournalTitle>
				<Issn>2252-004X</Issn>
				<Volume></Volume>
				<Issue>مقالات آماده انتشار</Issue>
				<PubDate PubStatus="epublish">
					<Year>2025</Year>
					<Month>04</Month>
					<Day>30</Day>
				</PubDate>
			</Journal>
<ArticleTitle>The Impact of Test Format on the Stability of Conditional Errors in Various Scaling Methods: A Case Study of Final Exams in the Second Stage of Secondary Education</ArticleTitle>
<VernacularTitle>تأثیر قالب آزمون بر ثبات خطای شرطی در روش‌های مختلف مقیاس‌پردازی: مورد مطالعه آزمون‌های نهایی دوره دوم متوسطه</VernacularTitle>
			<FirstPage></FirstPage>
			<LastPage></LastPage>
			<ELocationID EIdType="pii">18816</ELocationID>
			
<ELocationID EIdType="doi">10.22054/jem.2025.83753.3588</ELocationID>
			
			<Language>FA</Language>
<AuthorList>
<Author>
					<FirstName>ُسیدعلی</FirstName>
					<LastName>جعفری</LastName>
<Affiliation>دانشجوی دکتری سنجش و اندازه گیری دانشگاه علامه طباطبایی</Affiliation>

</Author>
<Author>
					<FirstName>جلیل</FirstName>
					<LastName>یونسی</LastName>
<Affiliation>استاد گروه سنجش و اندازه گیری،  دانشگاه علامه طباطبائی، تهران، ایران</Affiliation>

</Author>
<Author>
					<FirstName>ابراهیم</FirstName>
					<LastName>خدایی</LastName>
<Affiliation>استاد گروه آموزشی روش ها و برنامه ریزی آموزشی و درسی، دانشگاه تهران، تهران، ایران</Affiliation>

</Author>
<Author>
					<FirstName>نورعلی</FirstName>
					<LastName>فرخی</LastName>
<Affiliation>استاد گروه سنجش و اندازه گیری، دانشگاه علامه طباطبایی، تهران، ایران</Affiliation>

</Author>
<Author>
					<FirstName>علی</FirstName>
					<LastName>مقدم زاده</LastName>
<Affiliation>دانشیار گروه آموزشی روش ها و برنامه ریزی آموزشی و درسی، دانشگاه تهران، تهران، ایران</Affiliation>

</Author>
</AuthorList>
				<PublicationType>Journal Article</PublicationType>
			<History>
				<PubDate PubStatus="received">
					<Year>2025</Year>
					<Month>01</Month>
					<Day>12</Day>
				</PubDate>
			</History>
		<Abstract>Conditional Standard Error of Measurement (CSEM), which estimates the standard error of measurement at different score levels, is a critical index for measurement precision and aids in interpreting reported test scores. This study aimed to examine the stability of CSEM using three scaling methods—arcsine score transformation, general variance stabilization (gvs), and cubic transformation—across different test formats (multiple-choice, essay, and mixed). Data were drawn from a standardized test combining multiple-choice and essay questions, with two pseudo-tests designed based on separate formats. Results showed that the stability of CSEM depends on test format and structural features. The arcsine method was most stable for multiple-choice tests and performed well in mixed-format tests. The general variance stabilization (gvs) method excelled in mixed tests, providing the most stable CSEM with the least error across the ability scale. The cubic method also demonstrated better stability in mixed tests. These findings highlight the need to select scaling methods based on test characteristics and evaluation goals.</Abstract>
			<OtherAbstract Language="FA">خطای استاندارد اندازه گیری شرطی که براوردی از خطای استاندارد اندازه گیری در سطوح مختلف نمرات است، یکی از شاخصه های مهم دقت اندازه گیری است که می تواند به کاربران آزمون در تفسیر مناسب نمرات گزارش شده کمک کند. هدف این پژوهش بررسی ثبات خطای استاندارد اندازه‌گیری شرطی در سه روش تبدیل نمره آرک سینوس، تثبیت واریانس کلی و مکعب در قالب‌های مختلف آزمون (چندگزینه‌ای، تشریحی، و ترکیبی) بود. داده‌های این مطالعه از یک آزمون استاندارد با ترکیبی از سؤالات چندگزینه‌ای و تشریحی استخراج شد و دو شبه‌آزمون بر اساس قالب‌های جداگانه سؤالات طراحی گردید. نتایج نشان داد که ثبات خطای شرطی به قالب سؤالات و ویژگی‌های ساختاری آزمون وابسته است. روش آرک سینوس در آزمون‌های چندگزینه‌ای باثبات‌ترین خطای شرطی را ارائه داد و در آزمون ترکیبی نیز عملکرد مناسبی داشت. روش تثبیت واریانس کلی در آزمون ترکیبی بهترین عملکرد را نشان داد، به‌گونه‌ای که ضمن داشتن باثبات‌ترین خطای شرطی، کمترین مقدار خطا را نیز در طول مقیاس توانایی ارائه کرد. همچنین، روش مکعب در آزمون ترکیبی عملکردی باثبات‌تری داشت. نتایج این پژوهش نشان می‌دهد که انتخاب روش تبدیل باید بر اساس ویژگی‌های آزمون و اهداف ارزیابی انجام شود.</OtherAbstract>
		<ObjectList>
			<Object Type="keyword">
			<Param Name="value">مقیاس بندی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">خطای استاندارد اندازه گیری شرطی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">تبدیل آرک سینوس</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">تبدیل تثبیت واریانس کلی</Param>
			</Object>
			<Object Type="keyword">
			<Param Name="value">تبدیل مکعب</Param>
			</Object>
		</ObjectList>
</Article>
</ArticleSet>
