||
有网上资料说现在世界上信仰天主教的人数有13亿人。根据这个数字,如果我们随机地查验一个天主教徒的身份,他/她是罗马教廷的教皇的可能性是十三亿分之一,一个非常小的概率。那么我们是否就因此能够说,如果这位被随机查验的人碰巧就是教皇,教皇是天主教徒的可能性也很小很小呢?正确答案当然是‘教皇是天主教徒的概率是百分之一百’,之前的一句话的推理的逻辑是不成立的。再举个例子,我们不能因为有上吊自杀行为的人最终死亡的概率是很高的,因此就推论在死亡的人口中因为上吊而死的概率也很高。
在如今的科学研究的数据分析实践中,‘统计假设检验’范式(NHST=Null Hypothesis Significance Testing)被广大的科研工作者们普遍认为是科学的数据分析方法,没有统计假设检验数据分析结果的文章被接受发表在专业期刊上的可能性大大地降低。
‘统计假设检验’范式的推理逻辑是:在假定真正的效应值为零(H0)的前提下,如果根据所观察到的样本数据算得产生这样的样本数据的概率很小(比如p-值远小于0.05);于是我们可以有把握地推论说‘真正的效应值为零’(H0)这个假设成立的概率也很小。非常遗憾的是这个‘统计假设检验’范式的推断逻辑与前面举的两个得出违背常理的结论的例子完全是一样的。比如,在H0成立的条件下,观察到的样本数据的p-值很小;推论:在给定的很小的p-值的条件下,H0成立的概率也很小 -这样的推断结论的逻辑是不成立的!
请参看科学网—统计显著性问题的历史由来及最新进展 - 谢钢的博文 (sciencenet.cn)。我相信从1950年代开始的‘统计假设检验’范式的形成与流行给统计学教育及统计数据分析实践所带来的长期深远的危害将作为一个科学发展史上的最大失败的教训之一而被记录下来。
新的一年刚刚开始,愿科学网的博友同仁们能够与我一起向‘统计假设检验’范式(NHST)说‘不’!
注:对‘统计假设检验’范式里最关键的概念‘p-值’不熟悉的博友可以参阅科学网—美国统计学会的p-值声明发表一年后的情况跟踪总结 (2017)(摘译) - 谢钢的博文 (sciencenet.cn)里的这个部分“信息框内容:P-值问题的概要”。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 18:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社