moralscience的个人博客分享 http://blog.sciencenet.cn/u/moralscience

博文

关于样本:你不必太在意,也不必隐瞒自己 精选

已有 12401 次阅读 2021-4-1 12:37 |系统分类:科研笔记

我国的心理学研究者,在开展研究特别是撰写论文的时候,往往会遇到一个很大的困扰,那就是研究对象的取样问题。无论研究者下了多大的气力提高样本的代表性,但是,往往还有论文审稿者或评阅者质疑研究结果的代表性。有些研究者在论文中写道:“本研究随机选取XXX名被试。”如果有审稿者或评阅者询问“随机选取”的程序,那么从研究者描述的取样过程判断,研究者绝对没有随机取样,得到的样本也根本不是概率样本。

似此,心理学研究就卡在样本上了,许多研究者颇感头疼,不少审稿者与评阅者又抓住不放。

实际上,心理学的研究者和审稿者都不必太在意研究的样本,特别是研究者,也不必隐瞒自己的取样过程和样本情况,是便利取样就诚实描写。强行写上“随机选取”的作法,只会适得其反——这样写,不是无知无畏,就是有意欺骗。

我从心理学研究的方法论出发,对心理学研究进行两点解读,希望能够让研究者和审稿者从此不再纠结于取样问题。

先说些预备知识:心理学是研究人类行为与意识的科学;心理学在研究中,要把行为与意识抽象为变量;心理学研究,一般是通过样本而研究总体的——虽然,研究的总体可能是视情况而定的;心理学研究,要通过测量变量而进行;心理学研究,体现为考察变量之间的关系,特别是因果关系。

由上述知识,可以引出两个重要观点,即心理学研究需要对变量进行测量、心理学研究重在考察变量之间的因果关系。

心理测量学上有个重要理论,称为经典测验理论,它的内容非常简单,却十分深刻,即:测验分数等于真分数与测量误差的和。测验分数是具体测量的得分,真分数是研究者真正感兴趣的心理属性(例如,智力、人格),测量误差是测量过程中的偏差。要想使测验分数能够更好地表示心理属性,就要控制或减小测量误差。

测量误差包括随机误差与系统误差。系统误差,主要受研究条件的影响(例如,研究者用一套没有修订的智力量表,致使测得的智商偏低),研究者可以通过有关理论或现实情况而辨识,从而控制或减小。随机误差,是测量过程中的随机因素造成的,研究者难以辨识,控制或减小的方法是进行多次测量。从理论上讲,当测量次数趋于无穷时,随机误差就等于0

经典测验理论只考虑随机误差,不考虑系统误差。(可以认为,系统误差是一种特殊的随机误差——如果测量足够多,研究条件造成的系统误差也将等于0。)为了减小测量误差,需要对研究的心理属性进行多次测量。然而,对被试反复进行同样的测量有很大难度,例如,需要有N个测验副本、被试对相同测验感到厌倦而不配合。心理测量学家想到的解决办法是,对许多被试只测量1次。他们从数学上证明了,就某个心理属性而言,对1个人测量N次与对N个人测量1次是等价的。这是大规模心理测量的原理,虽然许多采用心理测量方法开展研究的人并不真正了解和理解。

由此不难看出,对1个人测量N次等于对N个人测量1次,即,对研究者感兴趣的心理属性而言,对1个人测量N次,就可以达到测量N个人的效果。如果N等于总体,那么,对1个人的N次测量就等于对总体的测量。(当然,从理论上讲,这里的N要足够大。)换句话说,对1个人的测量,可以达到测量总体的效果。显然,对1个容量大于1的样本进行测量,自然也是可以研究总体的。既然如此,研究者采用1个样本来开展心理学的研究,又有什么不妥呢?

此外,现在的元分析技术,即对许多同类研究的结果进行宏观分析,从理论上讲,可以解决研究样本偏差带来的误差。

心理学研究重在考察变量之间的因果关系,可从心理学研究的效度来解读。通常,可将心理学研究的效度分为4种,即内部效度、结构效度、统计效度、外部效度。结构效度对应研究主题的理论层面,特别是理论概念与测量指标的契合性。统计效度涉及研究中的统计正确性。按照我的理解,这两类效度是心理学研究的基本要求,此处不再多说。下面专讲内部效度与外部效度。

对心理学研究来说,内部效度是研究中的自变量与因变量之间存在因果关系的真实程度,外部效度是研究结论在其他情境中的真实程度。一项研究,首先需要保证的是内部效度,一般而言,外部效度可以不用特别考虑——原因非常简单:只要新的研究情境与原来研究情境存在任何差异,外部效度均可能无法保证,而造成情境之间差异的因素实在太多,所以,外部效度显得很难保证。

保证或提高内部效度的手段是控制,包括实验控制和统计控制。实验控制,主要是指在实验室做实验——可能有人觉得这种说法滑稽,实验不在实验室做在哪儿做?心理学实验完全可以在实验室外做。统计控制,主要是指协方差分析。心理学研究的控制,其实是降低外部效度的做法。

保证或提高外部效度的手段是取样。既然一般不需要特别在意外部效度,从而,也就不用特别在意取样。如果有人提出研究样本不具有代表性的问题,那么,研究者可以提出这样的问题:你怎么证明这个样本不具有代表性?

大家看英文文献,就会发现研究者只是描述被试情况,显得一点都不在乎样本的代表性。为什么呢?如果研究者显得在乎了,可能就有问题:歧视!例如,研究者用以广西大学生为样本的研究结果来表述大学生的情况,大家的直观感觉是不行的。可是,你有什么经过科学研究获得的证据表明广西的大学生与我国整体的大学生存在质的差异?

在心理学研究中,有些差异在数学上可能是那样的,但在伦理上是有问题的。特别地,不能随便提出人类自然属性方面的心理差异问题,例如,性别、身高、体重、体型、民族、种族、地区,等。所以,不能因为被试的地区而简单地判定相应的研究不具有代表性。

从理论上讲,心理学研究的样本应该是概率样本;从现实性讲,心理学研究的样本实际是便利样本。不要在论文中出现“随机取样”了!因为研究者几乎做不到,即,不会是、也不可能是随机取样。同样地,在论文的“本研究的不足与未来研究的方向”部分,也完全不用再写“本研究只是考察了XXXX,以后需要进一步扩大取样范围”。

我想,应该让有关专家知道这里所说的情况,否则,在论文评阅和/或答辩时,他们纠缠于这个问题,作者就陷于困境了——那样的情境,作者怎么敢跟专家较劲呢?

声明:本文的严谨性远远低于数学,所说观点,对教育学、社会学、医学等领域的研究或有启发,可能并不适用于工业、商业等领域——也就是说,本文的外部效度大概较低。



https://blog.sciencenet.cn/blog-2619783-1279724.html

上一篇:“唯书”的课堂教学:王二小真勇敢
下一篇:效应量:研究意义的试金石
收藏 IP: 116.1.49.*| 热度|

13 郑永军 曾杰 武夷山 杨正瓴 尤明庆 黄永义 农绍庄 彭真明 张晓良 范会勇 宁利中 张鹰 钟定胜

发表评论 评论 (10 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-20 04:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部