zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

对于P值,该何时、如何校正?

已有 1575 次阅读 2023-12-12 09:16 |系统分类:科研笔记

做数据分析的时候,有时候审稿人会提出我们最迷恋的统计量,也就是P值,有没有做校正。虽然现在软件发达,我们可以在软件中轻而易举的进行各种校正,但背后的逻辑和原理可能多数朋友并不十分清楚。

2019年,Jafari 和 Ansari-Pour 2019在Cell journal上发表了Why, When and How to Adjust Your P Values? 一文,较详细的介绍了P值校正的来龙去脉。Cell journal这杂志虽然影响因子不高,但这篇文章至今已被引用418次,足见把期刊的影响因子等同于论文质量的荒诞性!

图片2.png

好了,那么下面我们具体看下为何我们有时需要对P值进行校正。要理解这个问题,首先要明确一个叫“第一类型统计错误”的概念,这个统计错误说的就是当X对Y根本没有影响时,或者二者没有任何关系时,如果我们的统计模型结果是X对Y有影响,那么我们就犯了所谓第一类型统计错误(也就是弃真,即原假设是真的,我们把他拒绝了)。

那么,通常情况下,我们第一类型统计错误的概率有多大呢?这个跟我们预先设定的显著性水平有关。比如我们设定的显著性水平为0.05(这也是我们在统计中常用的值),那么,理论上对于一次统计检验来说,我们没有犯第一类型统计错误的概率就是1-0.05=0.95。 所以,我们犯第一类型统计错误的概率就是1-(1-0.05)=0.05(也就是我们没有能侦测到第一类型统计错误的概率)。所以假设你只进行了一次统计检验,那么你犯第一类型统计错误的概率是相当低的。

但是,当你进行了多次检验时,从概率的角度来讲,你犯第一类型统计错误的概率就会逐步提高:比如,如果你分别进行了20次和100次统计检验,那么你犯第一类型统计错误的概率就变为:

图片3.png

也就是说,当你进行了100次统计检验时,那么你的结果中,就非常有可能包括了一次第一类型统计错误了。

所以通常,针对同一组数据,当我们进行了多次不同的检验时(最常用的场景就是多重比较),我们就有必要对P值进行校正,以降低我们犯第一类型统计错误的概率

虽然不同的校正方法会导致不同的结果,但大都不外乎四个字“简单粗暴”。 比如最常用的P值校正方法,一个叫Bon校正,一个叫FDR校正。

其中,Bon校正最为简单,就是直接拿原始的P值乘以检验次数。

而FDR校正则稍细腻一些,其做法是首先把P值按从小到大的顺序进行排序。然后逐次给这些P值乘以m/k, 其中m是检验的次数,而k则是P值在排序中的位次。也就是说,FDR校正中,P值越小,排序位次越靠前,则受到的校正就越强;而P值越大,排序越靠后,则受到的校正就越小。所以很明显,FDR校正是一种更具针对性的P值校正方法,也是当前数据分析中,更为流行的方法。

参考文献:

Jafari, M., and N. Ansari-Pour. 2019. Why, When and How to Adjust Your P Values? Cell J 20:604-607.

最后,欢迎大家关注我的个人微信公众号:二傻统计

二傻统计二维码.png

更多应用统计技术相关信息请关注

图片4.png

 

 

 




https://blog.sciencenet.cn/blog-3442043-1413477.html

上一篇:Meta 分析Science 封面双杀
下一篇:Meta分析最少需要多少个案例,以一篇顶刊论文为例
收藏 IP: 210.72.152.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-11 23:48

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部