نوع مقاله : مقاله پژوهشی
نویسندگان
1 سنجش و اندازه گیری، دانشکده روان شناسی و علوم تربیتی، دانشگاه علامه طباطبائی، تهران، ایران
2 آمار، دانشکده علوم ریاضی و رایانه، دانشگاه علامه طباطبائی، تهران، ایران
چکیده
مدلیابی معادلات ساختاری، یک رویکرد آماری چندمتغیری نیرومند جهت ارزیابی روابط پیچیدهی بین متغیرهای مکنون در بسیاری از حوزههای علوم انسانی و رفتاری است. یکی از چالشهای رایج در برآورد مدلهای معادلات ساختاری که بر مبنای آزمون فرضیهها انجام میشود، وجود دادههای گمشده است. شیوهی معمول، حذف آزمودنیهایی با پاسخهای گمشده روی هر کدام از سوالات است که با افزایش درصد مقادیر گمشده در مجموعه دادهها، منجر به از دست رفتن حجم زیادی از اطلاعات نمونه و اریبی برآوردگرهای حاصل میشود. در تحلیل مدلهای معادلات ساختاری با حضور مقادیر گمشده میتوان از روش بیشینه درستنمایی با اطلاعات کامل استفاده کرد که در آن از تمام دادههای موجود در نمونه بهطور حداکثری استفاده میشود. در این مقاله، عملکرد روش بیشینه درستنمایی با اطلاعات کامل تحت هر سه مکانیسم دادههای گمشده شامل گمشدن کاملاً تصادفی، تصادفی و غیرتصادفی در یک مطالعهی شبیهسازی مورد بررسی قرار میگیرد. بدین منظور، دو مدل تحلیل عاملی تأییدی را در نظر گرفته، دادهها تحت هر سه مکانیسم مذکور تولید و تأثیر دو شاخص حجم نمونه (100 و 500) و درصد مقادیر گمشده (2%، 5%، 10%، 15%، 20%، 25%، 30%، 35% و 40%) بر شاخص ریشهی میانگین مجذورات خطاهای برآورد مورد بررسی قرار گرفته است. نتایج نشان میدهند که با افزایش درصد مقادیر گمشده، عملکرد مدلهای معادلات ساختاری با استفاده از روش بیشینه درستنمایی با اطلاعات کامل در حضور مکانیسمهای گمشدن کاملاً تصادفی، تصادفی و غیرتصادفی به طور کلی بهتر از عملکرد آن بدون استفاده از این روش بر حسب برخی شاخصهای نیکویی برازش است.
کلیدواژهها
عنوان مقاله [English]
Estimation of structural equation modeling with missing data using full information maximum likelihood method: a simulation study
نویسندگان [English]
- sheida moradi 1
- Shabnam Fani 2
- fateme pourkhaghan 1
1 Psychometrics, Faculty of psychology and educational sciences, Allameh Tabataba'i University , Tehran, Iran
2 Statistics, Faculty of Mathematical Sciences and Computer , Allameh Tabataba'i University , Tehran, Iran
چکیده [English]
Structural equation modeling (SEM) is a powerful multivariate statistical approach for assessing complex relationships between latent variables in many human and behavioral sciences. A common challenge in estimating structural equation models, which is based on hypothesis testing, is the presence of missing data. Deleting subjects with missing values on each of items is the usual way of handling missing data, which leads to biased estimators and lose a considerable amount of sample information as the percentage of missing values increases. In estimating SEM with missing values, one can apply the full information maximum likelihood (FIML) approach that makes maximal use of all available data from every subject in the sample. In this paper, the performance of FIML is investigated under three missing value mechanisms, missing completely at random, missing at random, and missing not at random, in a simulation study. Two confirmatory factor analysis models are considered, where the data is generated under three mechanisms and the impact of two indexes, sample size (100,500) and percentage of missing values (2%,5%,10%,15%,20%,25%,30%,35%,40%), are evaluated based on the root mean square error of approximation (RMSEA) index. Results show that the performance of SEM using FIML approach is generally better than the performance of SEM without using this approach in terms of some goodness of fit index.
کلیدواژهها [English]
- Structural Equation Modeling (SEM)
- Full Information Maximum Likelihood (FIML)
- Missing Completely at Random (MCAR)
- Missing at Random (MAR)
- Missing Not at Random (MNAR)