博文

对于P值，该何时、如何校正？

已有 1575 次阅读 2023-12-12 09:16 |系统分类:科研笔记

做数据分析的时候，有时候审稿人会提出我们最迷恋的统计量，也就是P值，有没有做校正。虽然现在软件发达，我们可以在软件中轻而易举的进行各种校正，但背后的逻辑和原理可能多数朋友并不十分清楚。

2019年，Jafari 和 Ansari-Pour 2019在Cell journal上发表了Why, When and How to Adjust Your P Values? 一文，较详细的介绍了P值校正的来龙去脉。Cell journal这杂志虽然影响因子不高，但这篇文章至今已被引用418次，足见把期刊的影响因子等同于论文质量的荒诞性！

图片2.png

好了，那么下面我们具体看下为何我们有时需要对P值进行校正。要理解这个问题，首先要明确一个叫“第一类型统计错误”的概念，这个统计错误说的就是当X对Y根本没有影响时，或者二者没有任何关系时，如果我们的统计模型结果是X对Y有影响，那么我们就犯了所谓第一类型统计错误（也就是弃真，即原假设是真的，我们把他拒绝了）。

那么，通常情况下，我们第一类型统计错误的概率有多大呢？这个跟我们预先设定的显著性水平有关。比如我们设定的显著性水平为0.05（这也是我们在统计中常用的值），那么，理论上对于一次统计检验来说，我们没有犯第一类型统计错误的概率就是1-0.05=0.95。所以，我们犯第一类型统计错误的概率就是1-(1-0.05)=0.05（也就是我们没有能侦测到第一类型统计错误的概率）。所以假设你只进行了一次统计检验，那么你犯第一类型统计错误的概率是相当低的。

但是，当你进行了多次检验时，从概率的角度来讲，你犯第一类型统计错误的概率就会逐步提高：比如，如果你分别进行了20次和100次统计检验，那么你犯第一类型统计错误的概率就变为：

图片3.png

也就是说，当你进行了100次统计检验时，那么你的结果中，就非常有可能包括了一次第一类型统计错误了。

所以通常，针对同一组数据，当我们进行了多次不同的检验时（最常用的场景就是多重比较），我们就有必要对P值进行校正，以降低我们犯第一类型统计错误的概率。

虽然不同的校正方法会导致不同的结果，但大都不外乎四个字“简单粗暴”。比如最常用的P值校正方法，一个叫Bon校正，一个叫FDR校正。

其中，Bon校正最为简单，就是直接拿原始的P值乘以检验次数。

而FDR校正则稍细腻一些，其做法是首先把P值按从小到大的顺序进行排序。然后逐次给这些P值乘以m/k, 其中m是检验的次数，而k则是P值在排序中的位次。也就是说，FDR校正中，P值越小，排序位次越靠前，则受到的校正就越强；而P值越大，排序越靠后，则受到的校正就越小。所以很明显，FDR校正是一种更具针对性的P值校正方法，也是当前数据分析中，更为流行的方法。

参考文献：

Jafari, M., and N. Ansari-Pour. 2019. Why, When and How to Adjust Your P Values? Cell J 20:604-607.

最后，欢迎大家关注我的个人微信公众号：二傻统计

二傻统计二维码.png

更多应用统计技术相关信息请关注

图片4.png

转载本文请联系原作者获取授权，同时请注明本文来自张霜科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3442043-1413477.html

上一篇：Meta 分析Science 封面双杀
下一篇：Meta分析最少需要多少个案例，以一篇顶刊论文为例

收藏 IP: 210.72.152.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

张霜

扫一扫，分享此博文

zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

对于P值，该何时、如何校正？

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

张霜

全部作者的其他最新博文

全部精选博文导读

zhang2sha的个人博客分享 http://blog.sciencenet.cn/u/zhang2sha

博文

对于P值，该何时、如何校正？

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

张霜

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)