||
统计学改革(statistics reform)又称为“统计改革”(statistical reform), “统计推断改革”(reform of statistical inference) , 或者“统计实践改革”(reform of statistical practice)。倡导统计学改革的学者(改革派)的主要观点是抛弃显著性检验,实行“效应量估计”(estimation of effect size)。
长期以来,统计显著性检验是科学研究中广泛使用,但是又一直有争议的统计推断方法。最近十几年来,显著性检验受到极大的挑战。这是因为越来越多的科学家和统计学家认为显著性检验的误用或滥用是造成“可重复性危机”的主要原因之一,并且认为 “可重复性危机”反映了显著性检验在方法论上的缺陷,即显著性检验范式本身有问题。因此,一些科学家和统计学家(改革派)呼吁彻底抛弃统计显著性概念和显著性检验。例如《美国统计学家》2019 年特刊“21 世纪的统计推断”的社论宣称 “现在是完全停止使用‘统计显著性’一词的时候了”【1】。2019年3月,800多位学者在《Nature》上联名呼吁‘抛弃整个统计显著性概念’【2】 。
显著性检验范式的主要缺陷之一是用‘统计显著性’代表‘科学显著性’。它引导(或者是误导)科学家关注‘统计显著性’,并且采用二分法来评定统计显著性,例如p 值<0.05被认为是具有统计显著性的标准。学术期刊倾向于发表p 值<0.05的成果助长了显著性检验的误用和滥用。与显著性检验范式相反,效应量估计 (范式)引导科学家关注‘科学显著性’,根据效应量估计直接进行科学推断。
其实统计学改革的呼声由来已久。Fidler 和Cumming 在2007年的论文【3】中写道:“许多学科都提出了改革统计实践的令人信服的论据,有的已经持续了几十年,但是实现改革被证明十分困难。” 2014年,作为统计学改革的主要倡导者 Cumming 提出了“新统计学”的概念,“新统计学”包括效应量估计,置信区间,荟萃分析等【4】。Cumming 表明这些“新”方法实际上并不新,但是广泛使用这些方法对于许多研究人员来说是新的。
统计学改革涉及制定新的期刊政策,编写和出版新的统计学教科书,编写和发行新的统计分析软件。这些工作已经在进行,尽管还没有全面铺开并且进展缓慢。例如心理学期刊《Basic and Applied Social Psychology》于2015年正式禁止使用显著性检验和置信区间 【5】;Cumming于2012年出版了关于新统计学的教科书【6】。Hurlbert等指出【7】:“统计学中的许多争议主要或完全是由于期刊质量控制不善、统计学教科书质量差、教学质量差、写作不清晰以及缺乏对历史文献的了解所致。” 他们建议:“…[在]科学文献中不允许使用“统计显著性”一词及其所有同源词和象征性附属词,除非重点放在统计学历史及其哲学和方法论上。”
然而迄今为止,学术共同体远远无法在范式转换上达成共识。改革派倡导抛弃显著性检验范式,以效应量估计作为新范式来取代显著性检验范式。保守派则强烈反对抛弃显著性检验范式【8、9】。改革派与保守派之间正在进行激烈的争论【例:8-11】。因此, 统计学改革将是一个漫长的过程。
参考文献及相关链接:
【1】 Wasserstein R L, Schirm A L, and Lazar N A, 2019. Editorial: Moving to a World Beyond “p < 0.05”, The American Statistician, Vol. 79. https://www.tandfonline.com/doi/full/10.1080/00031305.2019.1583913
【2】Scientists rise up against statistical significance, https://www.nature.com/articles/d41586-019-00857-9
【3】Fidler F and Cumming G 2007 Lessons learned from statistical reform efforts in other disciplines Psychology in the Schools 44 441-449
【4】Cumming G 2014 The New Statistics: Why and How Psychological Science 25 7–29
【5】Trafimow D and Marks M 2015 Editorial Basic and Applied Social Psychology 37 1-2
【6】Cumming G 2012 Understanding The New Statistics: Effect Sizes, Confidence Intervals, and Meta-Analysis New York: Routledge
【7】Hurlbert SH, Levine RA, and Utts J 2019 Coup de Grace for a Tough Old Bull: “Statistically Significant” Expires The American Statistician 73(sup1) 352-357 DOI: 10.1080/00031305.2018.1543616
【8】The ASA President’s Task Force Statement on Statistical Significence and Replicability https://errorstatistics.files.wordpress.com/2021/06/presidents-task-force-statement.pdf
【9】Karen Kafdar 2021 Statistical significance, p-values, and replicability
https://errorstatistics.files.wordpress.com/2021/06/kafadar-editorial-2021.pdf
【10】Megan Higgs 2021 Thoughts on the Task Force Statement https://critical-inference.com/thoughts-on-the-task-force-statement/
【11】Andrew Gelman 2021 Thoughts on “The American Statistical Association President’s Task Force Statement on Statistical Significance and Replicability”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 22:57
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社