moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

外部效度:其他群体、其他情境、其他时间 精选

已有 7764 次阅读 2021-6-23 23:59 |系统分类:科研笔记

在做心理学研究(特别是实验研究)的时候,研究者必须了解和关注内部效度,同时,也需要了解和关注外部效度。我在其他博文中不止一次涉及外部效度,并且往往不把外部效度视为主要矛盾或矛盾的主要方面。今天例外,我要重点介绍外部效度的问题,不过,也还得涉及内部效度——没有内部效度,外部效度就无从谈起。

一、研究逻辑

研究者开展心理学研究,通过控制,可以进行因果推论。控制有两种形式,一种是实验控制,一种是统计控制(McBurney, 1990)。这里主要讨论实验控制,即,使自变量之外的其他因素在各种实验条件下都保持恒定,从而使它们不能解释观测到的因变量的任何变化。显然,只有在研究者把自变量之外的其他一切都保持恒定的情况下,才能做出明确的因果推论,即自变量造成了观测到的因变量的变化。不过,这是一个永远都无法真正达到的情况——影响任何心理与行为的因素都太多了,根本无法把它们均保持恒定。这是一个无法回避的现实问题。对于研究来说,它既有不利的一面,也有有利的一面。

在实践上,研究者希望把那些很可能是结果变量变化的竞争性解释的变量保持恒定,把那些不太费劲就能保持恒定或者保持恒定对情境不致过于扭曲的变量保持恒定。至于其他变量,则希望它们在各种条件不造成系统差异的情况下允许变化。同时,还有一些变量,也是数量庞大的变量,研究者假设它们是无关的(即不影响因变量),是可以不予考虑的——虽然,这样假设,可能是错误的(原来以为无关,后来发现关系密切的情况不在少数)。

心理学研究者通常每次控制一个变量,在一系列的独立实验中控制不同的变量。换句话说,心理学研究都是针对具体的对象,在具体的情境、具体的时间进行的,这可以把内部效度最大化。同时,这样的研究现实,又引出了另外的问题,即,这样的研究结果和结论,对另外的对象、在另外的情境、另外的时间也成立吗?即研究结果和结论能够推广吗?

二、外部效度

心理学在具体研究与推广性之间存在一种不可避免的矛盾。推广性就是研究的外部效度,即一项研究所得的结果能够外推的程度。例如,实验发现对不同种族、阶层、性别、年龄的每个人都适用吗?或者,实验发现有某种程度的限制吗?比如,只适用于智力平均水平以上的中产阶层的美国白人城市青年?对于心理学研究来说,最糟的情况是,实验发现不能推广到特定实验所用的被试和情境之外——当然,这是极不常见的情况。

一些变量出于控制目的而保持恒定,可能导致研究发现的应用性存在局限。例如,假若研究者选择只用男性来做被试,即把性别这个变量在各种条件都保持恒定,那么,把研究发现推广到女性的程度将是有疑问的。现在,心理学研究者招募被试,男女不限,甚至刻意要求男女比例1:1,但是,20世纪70年代以前的美国心理学研究,却几乎全用男性作被试(Coolican, 2014)。

研究结果的推广性之所以称为外部效度,是因为它涉及一项研究的发现与研究所用的条件之外的情况的相关性。外部效度高的研究是推广性强的发现,即,研究发现能够适用于研究之外的其他群体、其他情境和其他时间。

由此易知,影响外部效度的因素,可以分为两类,一类是被试,一类是控制。心理学研究往往是对样本开展的,样本代表总体的情形是有差异的。具体的被试是研究者抽取总体的代表性样本吗?例如,许多心理学研究以大学生为被试,而大学生在人口总体中的占比并不高。不过,也不能自动地认为以某类群体为被试的研究就是缺乏外部效度的,这要具体问题具体分析。如果考察的心理与行为属性具有明显的某类群体的特点(比如,大学生,通常非常年轻、智力较高),并且考察的因变量与某类群体有很强的相依性(比如,推理、态度),那么,用这样群体中的样本为被试,研究的外部效度可能是较低的。否则,如果研究的是一般感知能力或运动能力,具体用某个群体中的样本为被试,应该是不会威胁到外部效度的。

控制影响外部效度,这是显而易见的。其他情境原来意指的是实验室外的情形,或者说现实情况,与实验室相对照。其他时间主要指不同的历史时期,也就是说,社会有较大变迁,人们的观念有较大变化的不同时间。

此外,前面提到研究者无法把自变量之外的其他一切都保持恒定既是不利之处,也是有利之处,那是因为,这个现实问题威胁内部效度,即为不利之处;这个现实问题其实支持外部效度,即为有利之处。也就是说,控制(无论实验控制还是统计控制),正是控制,可以提高内部效度,却要降低外部效度。

三、外部效度与内部效度的关系

尽管外部效度和内部效度都很重要,但是,内部效度更为重要。如果研究者做了一项实验,具有高的外部效度,但内部效度却低,那么,把含糊的实验发现推广到更多的人们和更多的情境,也没什么意义。相反,一项实验,如果有高的内部效度,那么它通常至少有一点儿可推广性。当然,理想状态是,研究者在心理学研究中既追求内部效度,又追求外部效度。不过,研究者应当主要把时间和精力用于确保实验至少有高的内部效度上。

常见的心理学研究(特别是实验),外部效度不可能很高。研究者做的实验必须内部效度要高——研究者能够将因变量的变化明确地与对自变量的操纵联系起来。追求高内部效度的关键之一是,把被试随机分派到各种条件或者把各种条件的顺序随机分派给被试。不要混淆了把被试随机分派到各种条件与从总体中随机取样,前者关涉的是实验的内部效度,后者关涉的是实验的外部效度。

尤其重要的是,可以从内部效度与外部效度来看待和分析一个重大问题,即,当前心理学研究的可重复性危机。如果一项心理学研究的内部效度没有太大问题(当然,结构效度、统计效度也要有保障),那么,这项研究没有得到重复,可以认为是外部效度较低甚至太低。这样来评价原初研究可能是更合理、更可取的。

参考文献

Coolican, H. (2014). Research Methods and Statistics in Psychology (6th ed.). London: Psychology Press.

McBurney D. H. (1990). Experimental Psychology (2nd ed.). Belmont, CA: Wadsworth Publishing Company.



https://blog.sciencenet.cn/blog-2619783-1292464.html

上一篇:两类基本效度:内部效度与结构效度
下一篇:认识行为的方式:权威、逻辑、直觉、完形、科学
收藏 IP: 220.173.126.*| 热度|

9 郑永军 许培扬 程少堂 黄永义 杨正瓴 杜占池 孙颉 张鹰 李东风

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 10:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部