|
只要阅读一篇应用结构方程模型的论文,就会看到文中呈现的一系列拟合指数,它们都用符号表示,其中,χ2总是排在第一。不过,有的研究者可能只是例行公事地给出这些拟合指数,并不理解对应的含义,亦不确切知道它们的作用,因此,流于模仿其他文献,列上拟合指数,按照有关资料提到的标准,接着描述“这些拟合指数表明,模型拟合数据良好。”
实际上,进行结构方程模型分析,就是检验研究者提出的模型与样本数据的拟合情况,也就是整体模型的拟合程度。研究者一般用χ2统计量作为结构方程模型整体拟合的检验。不过,χ2检验对样本量具有依存性(Bentler & Bonett, 1980),研究者就提出了评估模型拟合情况的其他拟合指数,作为χ2检验统计量的补充。可见,检验模型拟合数据程度的统计指标,原本就是χ2统计量,所以,报告结构方程模型的结果时,它位于最前面。其他拟合指数,可以分为3类,分别是增量拟合指数、绝对拟合指数、预测拟合指数(Kline, 2005)。
增量拟合指数(incremental fit indices)度量一个模型对数据拟合的改进程度,是通过比较一个具体结构方程模型与一个基线结构方程模型而得到的。典型的基线比较模型是零模型(null model),在这个模型中,所有变量都是彼此独立的,也就是不相关的(Bentler & Bonett, 1980),因此,又称独立模型(independence mode)。常见的增量拟合指数有:标准拟合指数(Normed Fit Index, NFI)、增量拟合指数(Incremental Fit Index, IFI)、非标准拟合指数(Nonnormed Fit Index, NNFI)或Tucker-Lewis指数(Tucker-Lewis Index, TLI)、比较拟合指数(Comparative Fit Index, CFI)、简约比较拟合指数(Parsimony Comparative Fit Index, PCFI)、相对非中心指数(Relative Noncentrality Index, RNI)。
绝对拟合指数(absolute fit indices)度量一个结构方程模型对样本数据所发现的各种关系的解释程度。常见的绝对拟合指数有:χ2/df比(χ2/df ratio)、拟合优度指数(Goodness-of-Fit Index, GFI)、调整的拟合优度指数(Adjusted Goodness-of-Fit Index, AGFI)、McDonald拟合指数(McDonald’s Fit Index, MFI)或McDonald中心性指数(McDonald’s Centrality Index, MCI)、伽马帽(Gamma Hat)、Hoelter N、均方根残差(Root Mean Square Residual, RMR)、标准化均方根残差(Standardized Root Mean Square Residual, SRMR)、近似均方根误差(Root Mean Square Error of Approximation, RMSEA)。
预测拟合指数(predictive fit indices),又称信息标准(information criteria),度量结构方程模型对来自同一总体的其他样本将会拟合的程度。常见的预测拟合指数有:Akaike信息标准(Akaike’s Information Criterion, AIC)、稳定性AIC(Consistent AIC, CAIC)、贝叶斯信息标准(Bayesian Information Criterion, BIC)、预期交叉验证指数(Expected Cross-Validation Index, ECVI)。
显然,结构方程模型的拟合指数十分多样。关于如何报告这些指数以及每个拟合指数的临界值,有不同的推荐标准(例如,Kline, 2005)。研究者通常把IFI、GFI、AGFI、MFI的值>.90作为可以接受的临界值(Bentler & Bonett, 1980)。后来,结构方程模型的研究者提出,把.95作为一个更理想的水平(例如,Hu & Bentler, 1999)。同时,SRMR<.10、RMSEA≤.05,表示模型拟合是可以接受的。
关于这些指数的使用以及拟合结构方程模型的临界值一直存在争论(例如,Marsh, Hau, & Wen, 2004)。存在这类争论的一个原因是,从哪个指数是最佳的角度讲,研究发现是混杂的,拟合效果依赖于诸多研究特征,包括变量的个数(Kenny & McCoach, 2003)、估计方法(Hu & Bentler, 1998)、模型误设(Hu & Bentler, 1999)、样本量(Marsh, Balla, & Hau, 1996)。因此,研究者应当清楚,建议的临界标准是一般的指导方针,并不一定是最终的规则。
按照Kline(2005)的观点,需要报告的拟合指数至少包括:(1)χ2检验统计量及其对应的自由度、显著性水平;(2)RMSEA及对应的90%置信区间;(3)CFI;(4)SRMR。
Hu & Bentler(1999)推荐,报告结构方程模型的发现时,使用两种指数的组合。具体而言,他们推荐使用SRMR和如下的一个指数:NFI、IFI、RNI、Gamma Hat、MFI、RMSEA。
虽然有证据表明,Hu & Bentler(1999)的联合标准有助于将拒绝正确模型的可能性最小化,但是,也有证据表明,当用这些临界标准时,错设的模型可能会被认为是可以接受的。因此,关于需要报告的最少拟合指数,可以采用Kline(2005)推荐的方案。
此外,结构方程模型是逐渐接近真相的,只要可能,研究者就比较竞争模型,并报告预测拟合指数(Worthington & Whittaker, 2006)。最为重要的是,研究者应当总是基于相关理论来选择合适的模型。
参考文献
Bentler, P. M., & Bonett, D. G. (1980). Significance tests and goodness of fit in the analysis of covariance structure. Psychological Bulletin, 88, 588-606.
Hu, L., & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Sturctural Equation Modeling, 6, 1-55.
Kenny, D. A., & McCoach, D. B. (2003). Effect of the number of variables on measures of fit in structural equation modeling. Sturctural Equation Modeling, 10, 333-351.
Kline, R. B. (2005). Principles and Practice of Structural Equation Modeling (2nd ed.). New York: Guilford.
Marsh, H. W., Balla, J. R., & Hau, K. T. (1996). An evaluation of incremental fit indices: A clarification of mathematical and empirical properties. In G. A. Marcoulides & R. E. Schumacker (Eds.), Advanced Structural Equation Modeling: Issues and Techniques (pp. 315-353). Mahwah, NJ: Lawrence Erlbaum.
Marsh, H. W., Hau, K. T., & Wen, Z. (2004). In search of golden rules: Comment on hypothesis-testing approaches to setting cutoff values for fit indexes and dangers in overgeneralizing Hu and Bentler’s (1999) findings. Sturctural Equation Modeling, 11, 320-341.
Worthington, R. L., & Whittaker, T. A. (2006). Scale development research: A content analysis and recommendations for best practices. The Counseling Psychologist, 34, 806-838.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 11:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社