heninghuang的个人博客分享 http://blog.sciencenet.cn/u/heninghuang

博文

零假设显著性检验 (NHST)的问题是“误用”吗?

已有 365 次阅读 2025-1-7 08:16 |个人分类:统计推断与概率|系统分类:观点评述

零假设显著性检验,英文为null hypothesis significance testing,简称NHST最近十几年来,学NHST作为科学推理工具的有效性的疑越来越重,是因科学研究上的多新发现认为假阳性,无法被重复试验证实,称之可重复性危机改革派学者认为NHST是造成可重复性危机的主要原因之一,而NHST范式在哲学上和方法论上是错误的,因此主张放弃NHST。保守派学者不承认NHST是错误的,他们认为NHST的问题是研究人员NHST的误用造成的。因此,他们建议通过加强统计学教育来避免误用。

David Trafimow 最近发表了一篇论文反驳NHST的问题是“误用”的观点1David Trafimow在论文结论中写到: 

“我们从流行的“误用”观点开始,即 NHST 的问题不在于其方法本身,而在于研究人员没有受到足够的教育来正确使用它以避免误用。继续用流行的说法,“把婴儿和洗澡水一起倒掉”是错误的。这里潜在的假设是,NHST 确实可以被正确使用;即确实有一个婴儿不应该和洗澡水一起倒掉。….[然而]这里没有婴儿!为了强调这一点,我对那些继续支持 NHST 可以被正确使用的人提出一个挑战。这个挑战是:列举在管理、营销或心理学历史上NHST 被正确使用的一项研究(即所有假设都被证明是正确的)。

如果无法列举NHST被正确使用的一项研究(即对挑战响应的失败),则表明任何NHST 的使用都是误用。因此,除非研究人员所接受教育是不要使用 NHST,否则教育不可能防止NHST的误用。问题不在于教育,而在于 NHST 无法提供合理的方法处理假设。由于研究人员希望通过一种统计仪式来证明他们处理假设的合理性(并促进他们的职业生涯),而 NHST 提供了这种仪式,因此潜在的问题更多的是诱惑而不是教育。消除这种诱惑的一个显著方法是期刊编辑拒绝发表依赖 NHST 的论文。可能还有其它方法可以减轻诱惑问题,这些方法值得研究。

NHST 爱好者不断地谈论误用的问题,谨慎的读者会意识到其中的含义。这意味着即使是NHST爱好者也承认NHST 对科学造成了巨大的危害。我们在这里看到了一些危害,包括不合理的推理、认为效应量对检验方向性预测无关紧要的糟糕论断、避免样本量过大的错误建议,以及效应量膨胀。但还有许多其它的(这里不做评论)已经被那些继续传播误用论点的人评论过(例如,Vidgen 和 Yasseri,2016 年)。这些人和我之间的分歧不在于 NHST 是否损害了科学,因为我们都同意这一点,尽管我们可能对具体的危害类别存在分歧。相反,主要的分歧在于对危害原因的不同看法。如果危害是由于NHST的误用造成的,那么通过教育可以消除误用而只留下正确的使用,这对商业和社会科学有潜在的好处。而如果不存在NHST的正确使用,那么所有的NHST使用都是误用。无论如何教育,只要统计仪式的诱惑仍然存在,NHST将继续损害科学。”

参考文献 

1Trafimow D.  (2024). Distinguishing Between Models and Hypotheses: Implications for Significance TestingMeta-Psychology, 8, MP.2021.2957 https://doi.org/10.15626/MP.2021.2957



https://blog.sciencenet.cn/blog-3427112-1467691.html

上一篇:p值谬误的一个实例
下一篇:“为什么在科学研究中应该放弃 p 值”论文预印本在“Qeios”上线
收藏 IP: 104.63.253.*| 热度|

6 冯兆东 王涛 宁利中 谢钢 刘全慧 尤明庆

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-8 14:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部