|
在现实生活中存在一种现象,人们形成某种观念之后,就很难改变,哪怕面对事实、面对证据,依然不愿接受新的观念。更为要紧的是,这种现象在科学研究中也有踪影。先表述一个观点:回归分析与相关分析是一回事。再具体一点:在研究中,做了相关分析,就不用再做回归分析了;或者,做了回归分析,前面做的相关分析就不用保留了。
学习过统计学的人大概都能记得,教科书上先讲相关分析,再讲回归分析,从而,给人留下的印象是,相关分析与回归分析是彼此独立的两种统计技术,并且,相关分析是回归分析的基础。这样一来,人们无意之中就轻视相关分析,而重视回归分析。
具体到心理学领域,太多的研究者遵循的套路都是:只要可能,就先做相关分析,再做回归分析。甚至还会讲出这样做的理由:相关分析只能知道两个变量之间是否有关系,回归分析才能由一个变量预测另一个变量。
在研究报告中,对于相关分析的结果,通常只是呈现相关系数,给出显著性检验的概率范围(例如,p< 0.05);对于回归分析的结果,通常会呈现回归分析的显著性检验结果(例如,F值,概率范围),以及回归系数,甚至还会呈现回归方程。所以,人们自然觉得回归分析更高级,相关分析太简单。
实际上,相关分析与回归分析是一回事,回归分析要达到的目的,相关分析也能达到。通过例子,就能清楚地看到这一点。仍然用上篇博文的例子,即考察两组(拼写困难组与对照组)被试的智商与视觉记忆的关系。
对两组全体被试来说,进行相关分析,智商与视觉记忆之间具有显著的正相关,r= .454, p= .044,效应量R2= .207;进行回归分析,结果表明,智商能够显著预测视觉记忆,F(1,18) = 4.686, β= .454, p= .044,效应量R2= .207。不难发现,两种分析的检验结果是相同的,包括p= .044、效应量R2= .207,而相关系数 = 回归系数。如果具有效应量的知识,那么就更清楚,对于两个变量之间关系的考察,重要的不是相关系数或回归系数,而是效应量。回归分析与相关分析所能反映的关键指标(效应量)的结果是一样的,从而,回归分析与相关分析就是一回事。
再用两个组的数据分别验证一下。对于拼写困难组来说,智商与视觉记忆之间的相关系数r= -.329, p= .353,效应量R2= .108;回归分析表明,F(1,8) = 0.973, β= -.329, p= .353,效应量R2= .108。对于对照组来说,智商与视觉记忆之间的相关系数r= -.039, p= .915,效应量R2= .002;回归分析表明,F(1,8) = 0.012, β= -.039, p= .915,效应量R2= .002。显然,对应的相关系数、显著性水平、效应量都是一样。
由此可见,回归分析与相关分析的确是一回事,至少对于双变量的回归分析与相关分析是这样——虽然回归分析显得复杂和高级一些,例如,多用了一些统计量,特别是希腊字母表示的统计量。
了解“回归分析与相关分析是一回事”,即两种分析是等效的,有什么用呢?这个观念可以回应美国心理学会统计显著性检验专门工作小组的一个建议:不要在结果部分呈现相关矩阵,因为研究者对一个或两个相关系数感兴趣是有道理的,但是,如果研究者对相关矩阵中的所有相关系数都感兴趣,那么,这就需要讲清楚为什么了。一般来说,研究者不会对相关矩阵中的所有相关系数都感兴趣,否则,就是没有用矛盾论指导自己的研究,从而,相应的研究就是没有主要矛盾或/和没有矛盾的主要方面。
当然,相关分析和回归分析各有更适合的呈现结果的情形。例如,进行因素分析时,呈现因子得分之间、因子得分与量表总分之间的相关矩阵,可以方便地考察特定量表的因子结构。对于其他情形,用回归分析而呈现回归系数往往是比较方便的。
同时,了解“相关分析和回归分析是一回事”,还有助于加强研究者的专业素养,例如,真正看重效应量,而不是统计显著性检验结果,即p值。
最后,必须说明的是,“回归分析与相关分析是一回事”这个观点,并非我提出来的,而是从程昌伦老师那里听来的。我读研究生时,程老师给我们讲授《实验设计的数学模型》课程。作为学位论文答辩的一名成员,程老师每年都要指出这个问题,说从数学上讲,回归分析与相关分析是一回事。但是,下一年的学生,即使观摩了上一年的学位论文答辩,仍然会在学位论文中既呈现相关分析的结果,又呈现回归分析的结果。噫!观念改变之难,由此可见一斑。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 07:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社