|
在心理测量中,测量工具的信度是基础。信度反映的是测得结果的可靠性,包括跨时间的可靠性(称为时间稳定性)与跨题项的可靠性(称为内部一致性)。考察时间稳定性,至少需要两次测试,考察内部一致性,一次测试即可。因此,心理测量的实证研究者都会考察和提供内部一致性的资料,并且,往往希望得到高的内部一致性系数。然而,这可能是不合适的,特别是在缩减量表的时候,由于要删除题项,这个问题就愈加值得关注了。
缩减量表,需要考虑量表的题项属性或特征。题项特征分为内部题项品质、外部题项品质、判断性题项品质3大类(Stanton, Sinar, Balzer, & Smith, 2002)。其中,内部题项品质是由量表本身决定的题项属性,亦即自我参照的题项特征。这类特征的指数在编制量表和缩减量表时容易使用,因为只要给定包含题项水平的数据集(data set),不需要量表及其成分题项之外的任何内容,就可评估它们。
传统上,内部题项品质主要包括数据分布特征(例如,均值、方差、偏度、峰度)、题项与量表总分的相关、因素分析的载荷。项目反应理论(Item Response Theory, IRT)是经典测验理论(Classical Test Theory, CTT)的一种替代理论,用若干参数描述题项的属性,比如,用参数a描述题项的区分度,用参数b描述题项的难度——对于非能力测量,参数b表示阈限(threshold)。获得了被试的题项反应和总量表分数,就可以在项目反应理论的框架里评估题项。
从理论上讲,任何内部题项品质,均可作为缩减量表的基础。但是,有关文献显示,在缩减量表时,选择题项的最常用方法是某种形式的内部一致性的最大化(Stanton, Sinar, Balzer, & Smith, 2002)。内部一致性表示构成一个量表的题项是彼此相关的总体程度。以Cronbach α系数的形式最大化内部一致性,是量表缩减的常用策略(Kopalle & Lehmann, 1997)。
缩减量表时,改动的题项与总分的相关系数能够提供内部一致性的诊断信息,从而,在量表缩减工作中,题项与总分的相关系数就会被作为简式量表版本保留题项的依据(例如,Arthur & Day, 1994)。由于用软件统计可以方便地得到题项与总分的相关系数,那些希望缩减量表的研究者,通常会输出这些数据,却没有其他实证信息作为量表缩减决策的基础。基于题项与总分的相关来选择题项存在局限性,然而,在许多情况下,研究者还是使用简单的题项分析方法,可能的原因是,他们缺乏其他方法。
因素分析用于量表缩减时,也是能够提高内部一致性的技术。因素分析提供的载荷显示了维度与单个题项之间的关系强度。通过提取一组特定题项之下的维度或因素,研究者可以删除那些在感兴趣因素上载荷较小的题项。因此,研究者常常使用载荷来缩减量表,例如,删除载荷<.30或.40的题项(Cacioppo, Petty, & Kao, 1984)。
最大化内部一致性的量表缩减技术很普遍,但是,这样的作法存在明显的缺陷。Boyle(1991)以心理测量学和量表编制的大量文献为基础,讨论了相应的缺陷。他的基本观点是,通过选择题项来最大化内部一致性,将会导致题项高度冗余,内容过于狭窄,效度可能很低。显然,很高的内部一致性通常表明的是,量表没有从所测结构领域的各个部分充分地获得样本内容。
实际上,为了得到高的α系数,量表编制者只需写出一组彼此转述或者相互反义的题项即可。同样地,研究者可以在缩减量表时使用类似的方法,获得同等的结果,造成题项高度冗余,只保留那些在内容上高度相似的题项,而排除了其他题项。
总之,只是集中于最大化内部一致性的量表缩减策略,其潜在的负性结果包括因素结构问题、对结构的测量狭窄、效度降低、不适用于其他文化(Stanton, Sinar, Balzer, & Smith, 2002)。一项蒙特卡罗研究发现,为了提高Cronbach α系数而从量表中删除题项的程序,可能导致高估量表的真实α系数,也就是高估量表的信度(Kopalle & Lehmann, 1997)。实际上,如果研究者要确保广泛覆盖所测的特定结构,尤其是在动机、人格、心境等非能力领域,那么,中到低的题项同质性其实是首选(Boyle, 1991)。
相比之下,项目反应理论提供了不集中于最大化内部一致性的量表缩减策略。研究者可以根据a参数,保留那些区分度高(即,a值中到大)的题项,同时,根据b参数,使保留的题项包括不同程度的阈限,从而,能够充分覆盖所测个体中预期的特质范围(Stanton, Sinar, Balzer, & Smith, 2002)。
参考文献
Arthur, W., & Day, D. V. (1994). Development of a short form for the Raven Advanced Progressive Matrices Test. Educational and Psychological Measurement, 54, 394-403.
Boyle, G. J. (1991). Does item homogeneity indicate internal consistency or item redundancy in psychometric scales? Perosnality and Individual Differences, 12, 291-294.
Cacioppo, J. T., Petty, R. E., & Kao, C. F. (1984). The efficient assessment of need for cognition. Journal of Personality Assessment, 48, 306-307.
Kopalle, P. K., & Lehmann, D. R. (1997). Alpha inflation? The impact of eliminating scale items on Cronbach’s alpha. Orgnaizational Behavior and Human Decision Processes, 70, 189-197.
Stanton, J. M., Sinar, E. F., Balzer, W. K., & Smith, P. C. (2002). Issues and strategies for reducing the length of self-report scales. Personnel Psychology, 55, 167-194.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 01:37
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社