|
很多本科毕业生和研究生不明白计算相关系数为什么还要搞显著性检验。假如你遇到了两个数列(或两个现象),发现它们的相关系数比较大,那它们是真的有关系,还是根本就是碰巧了(瞎猫撞上了死老鼠,或者天上掉馅饼)?而碰巧得到这么大相关系数的可能性是多大呢?这就需要相关性的显著性检验。如果你检验后发现在0.01水平上显著,说明碰巧达到这么大相关性的可能性不超过0.01,因此,遇到类似的相关性现象很可能是真实的,但是也有很小的可能(不到百分之一的可能性)是“碰巧”。那么当你得到的相关系数很小,比如只有0.15,是不是就认为两个现象之间完全无关呢? No,如果计算相关的样本量足够大,这个相关就很可能通过了0.001的显著性检验,也就是说只有千分之一以下的可能性是“碰巧”达到了这么高的相关,另外千分之999的可能性是确实存在着关系。
相关的显著性取决于样本量和相关系数的大小,样本量越大,相关系数越大,显著性就越高,即就越不可能是碰巧发生的。举个不完全贴切的例子:某个地方两次失窃,均出现了某个人并不意味着这人是小偷。但是,二十次失窃时有十二次均出现了这个人,说明这个人是小偷嫌疑就很大了,碰巧在十几次失窃处出现这个人的机率大概只有几百分之一(具体是多大请查看相关系数显著性检验表)。由此可见,做科研时为了证明某一个理论推测,你就得重复做实验很多次来验证才能作为结论,即让样本量达到一定的数才能使结论更加可靠。如果只做了5次就认为理论是正确的,那你就错了,可能真的碰到了天上一次掉下来五个馅饼的事。这就是为什么一个人做一件好事(或者坏事)不难(碰巧就能做一件),但一个人一直做好事(坏事)就很难了,因为你得处心积虑地去做才行。
再举个例子,某天你被一个天上掉下的馅饼砸中了,那可能是楼上某个小朋友掉下的,属于随机偶遇事件,你不用思考发生了什么。但是一段时间内,你被馅饼砸中了十几次,随机发生这种概率的可能性近似为0,那一定是某个人在暗恋你,或者是与你有仇,需要注意了。比如,西门庆偶遇潘金莲用晾衣杆砸他,可能就不是不小心发生的,可能就是故意砸的,但要确定是不是故意的,那还是要再多次路过,看还砸不砸。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 19:14
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社