moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

详解各指数,知晓其奥妙

已有 6135 次阅读 2022-3-26 23:57 |系统分类:科研笔记

行为和意识规律隐藏在现实之中,发现相应的规律需要科学方法。在具体的研究中需要各种工具,心理量表是心理学研究的基本工具。编制或缩减心理量表,就是创造或改造研究工具。透过缩减心理量表,可以一览心理学研究的创造性和严谨性。

前文介绍了研究者(Stanton, Sinar, Balzer, & Smith, 2002)缩减“工作描述指数”的背景,呈现了他们缩减量表的15个指数,也就是评估保留题项的依据。研究者为什么选择这样的指数?它们分别表示什么意思?下面进行详细解说。

研究者从内部、外部、判断性3个方面设定缩减量表的题项品质指数。内部题项品质是指那些在题项与量表中自我参照的度量指标。研究者采用并计算的此类指数共有9个。

首先,是每个题项的均值、方差、偏度、峰度4个指数。它们是反映题项基本品质的分布统计量,常用的统计软件都能输出对应的值。均值和方差分别代表被试在题项上反应的集中趋势和离散趋势,偏度和峰度可以检验被试反应的正态性。均值接近量尺的上下端点、方差太小、极不符合正态分布的题项,都可能是有问题的,这些情况影响一个题项与其他题项的相关(Nunnally & Bernstein, 1994)。研究者预期,“工作描述指数”中的有效题项均不存在不良的分布特征;同时,他们也想看看这些统计量是否存在与其他题项品质指数有关的微妙变化。

其次,是项目反应理论的参数a和参数b、题项与总分的相关3个指数。研究者对“工作描述指数”每个层面中的题项做项目反应分析,得到等级反应模型的参数a和参数b。模型要求题项能够显示一个单独的共同特质(即,一个单维因素),因此对“工作描述指数”每个层面计算单独的模型。在每个模型中,参数a,即区分度参数,反映一个题项对高满意度者与低满意度者的区分程度。

总的来说,虽然区分度中等的题项能够覆盖特质水平更广的被试,不过,大的a值表示良好的题项。参数a同题项与总分的相关存在对应性(Nunnally & Bernstein, 1994)。经典测验理论把题项与总分的相关作为区分度的一种操作定义,很多文献依据这种相关选择保留的题项,因此,研究者在分析中包括这个指数,预期项目反应理论的参数a同题项与总分的相关可以提供类似的结果。

项目反应理论的参数b表示所测结构连续体上反应概率为50%的点,也就是连续体上两种反应同样可能的点。这种思想可以推广到两种反应选项以上的情境。在例文中,有两个参数b,一个表示“否”与“?”反应之间的中点,另一个表示 “?”与“是”反应之间的中点。由于两个参数b是高度相关的(r=.97),因此,研究者只用了第一个。项目反应理论的参数b与经典测验理论的难度指数是同等的(Nunnally & Bernstein, 1994)。对于有多个反应点的态度题项,等效的度量指标是题项的均值,因此,研究者预期项目反应理论的参数b与题项均值得到类似的结果。

再次,是每个题项与其他题项及相应层面分数的协方差这个指数。对于“工作描述指数”的5个层面,研究者对层面内的题项做了主成分分析,获得了每个题项在第一主成分上的载荷。

最后,研究者采用回归诊断指数,即方差增大因子(variance inflation factor, VIF),作为共线性(collinearity)的标准回归诊断指数。这个指数反映回归方程中各个预测变量彼此重叠的程度。大的VIF值表示一个题项与那个层面的其他题项更为冗余。

外部题项品质反映一个题项与外部效标的关系。在例文中,研究者选用两个量表来计算“工作描述指数”的此类品质指数。其一,总体工作量表(job-in-general scale),是工作满意度的总体测量,与完整“工作描述指数”各个层面存在中度相关(Ironson et al., 1989)。其二,辞职意向量表(intentions to quit scale),是工作满意度研究中的一个常见结果测量指标(Stanton, Sinar, Balzer, & Smith, 2002)。在例文中的国家样本中,与总体工作量表存在实质的相关(r=-.66)。采用这两个外部效标的内在假设是,题项与效标的相关越高,表示题项的品质越好。

判断性题项品质是指那些需要主观判断的问题。在例文中,研究者获得了4个此类品质的指数。

第一,对每个题项的质量评定。这种评定来自专家样本。给被试的指导语是:“我们请您以自己的使用经验或您对一个高质量测量工具的总体印象,对一个题项的质量进行总体判断。我们有意相当宽泛地界定质量,您可以根据自己的理解,自由地界定质量。”研究者预期,这样的评定可以反映表面效度,也可能涉及题项对结构的核心性考虑。

第二,好工作与坏工作差异的评定。这种评定来自雇员样本,通过两项任务完成。在第一项任务中,要求被试从每个层面划出可以描述自己曾经做过或想像的最好工作的题项。在第二项任务中,要求被试从每个层面划出可以描述自己认为的最坏工作的题项。差异指数是两项任务评定之差的绝对值。研究者预期,这样的差异也能反映每个题项的表面效度。

第三,计算每个题项“?”反应的比例。这个指数来自国家样本的反应模式。虽然“工作描述指数”的“?”选项的得分位于“是”与“否”之间,但是,研究者预期,高的“?”反应比例可能提示一个模糊的题项,即,这个题项在某些工作情境中是不适合的。因此,这个比例可以作为判断性题项品质的一种度量。

第四,计算每个题项“是”反应的比例。这个指数也来自国家样本的反应模式,可以反映默认偏差(acquiescence bias),即被试对肯定选项的倾向性反应。其实,把“是”反应的比例定义为默认偏差,是不完美的,因为它与题项的描述统计量(比如,均值)是相关的。

总之,研究者在选定缩减量表的题项品质指数时,可以从内部、外部、判断性3个方面进行思考,其中,内部题项品质指数较多,外部题项品质指数较少,判断性题项品质指数居中。选择和确定这些指数,研究者既需要遵循原则性,也可以发挥创造性。

参考文献

Ironson, G.,Smith, P. C., Brannick, M. T., Gibson, W. M., & Paul, K. B. (1989). Construction of a Job in General scale: A comparison of global, composite, and specific measures. Journal of Applied Psychology, 74, 193-200.

Nunnally, J. C., & Bernstein, I. H. (1994). Psychometric Theory (3rd ed.). New York: McGraw-Hill.

Stanton, J. M., Sinar, E. F., Balzer, W. K., & Smith, P. C. (2002). Issues and strategies for reducing the length of self-report scales. Personnel Psychology, 55, 167-194.



https://blog.sciencenet.cn/blog-2619783-1331198.html

上一篇:一例知深浅,背景先呈现
下一篇:指数再分析,揭示新关系
收藏 IP: 220.173.126.*| 热度|

16 王平平 宋玉 侯丹 杨韩 李世斌 张晓良 尤明庆 杨正瓴 刘秀梅 李学宽 杜占池 孙颉 王安良 张俊鹏 李毅伟 马鸣

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-25 04:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部