||
“零假设显著性检验”,英文为null hypothesis significance testing,简称NHST。最近十几年来,学术界对NHST作为科学推理工具的有效性的质疑越来越严重,这是因为科学研究上的许多新发现被认为是“假阳性”,无法被重复试验所证实,称之为“可重复性危机”。改革派学者认为,NHST是造成“可重复性危机”的主要原因之一,而NHST范式在哲学上和方法论上是错误的,因此主张放弃NHST。保守派学者不承认NHST是错误的,他们认为NHST的问题是研究人员对NHST的误用造成的。因此,他们建议通过加强统计学教育来避免误用。
David Trafimow 最近发表了一篇论文反驳NHST的问题是“误用”的观点【1】。David Trafimow在论文结论中写到:
“我们从流行的“误用”观点开始,即 NHST 的问题不在于其方法本身,而在于研究人员没有受到足够的教育来正确使用它以避免误用。继续用流行的说法,“把婴儿和洗澡水一起倒掉”是错误的。这里潜在的假设是,NHST 确实可以被正确使用;即确实有一个婴儿不应该和洗澡水一起倒掉。….[然而]这里没有婴儿!为了强调这一点,我对那些继续支持 NHST 可以被正确使用的人提出一个挑战。这个挑战是:列举在管理、营销或心理学历史上NHST 被正确使用的一项研究(即所有假设都被证明是正确的)。
如果无法列举NHST被正确使用的一项研究(即对挑战响应的失败),则表明任何NHST 的使用都是误用。因此,除非研究人员所接受教育是不要使用 NHST,否则教育不可能防止NHST的误用。问题不在于教育,而在于 NHST 无法提供合理的方法处理假设。由于研究人员希望通过一种统计仪式来证明他们处理假设的合理性(并促进他们的职业生涯),而 NHST 提供了这种仪式,因此潜在的问题更多的是诱惑而不是教育。消除这种诱惑的一个显著方法是期刊编辑拒绝发表依赖 NHST 的论文。可能还有其它方法可以减轻诱惑问题,这些方法值得研究。
NHST 爱好者不断地谈论误用的问题,谨慎的读者会意识到其中的含义。这意味着即使是NHST爱好者也承认NHST 对科学造成了巨大的危害。我们在这里看到了一些危害,包括不合理的推理、认为效应量对检验方向性预测无关紧要的糟糕论断、避免样本量过大的错误建议,以及效应量膨胀。但还有许多其它的(这里不做评论)已经被那些继续传播误用论点的人评论过(例如,Vidgen 和 Yasseri,2016 年)。这些人和我之间的分歧不在于 NHST 是否损害了科学,因为我们都同意这一点,尽管我们可能对具体的危害类别存在分歧。相反,主要的分歧在于对危害原因的不同看法。如果危害是由于NHST的误用造成的,那么通过教育可以消除误用而只留下正确的使用,这对商业和社会科学有潜在的好处。而如果不存在NHST的正确使用,那么所有的NHST使用都是误用。无论如何教育,只要统计仪式的诱惑仍然存在,NHST将继续损害科学。”
参考文献
【1】Trafimow D. (2024). Distinguishing Between Models and Hypotheses: Implications for Significance TestingMeta-Psychology, 8, MP.2021.2957 https://doi.org/10.15626/MP.2021.2957
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-8 14:36
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社