英论阁Enago官方博客分享 http://blog.sciencenet.cn/u/Enago

博文

P值真的万能吗?

已有 2708 次阅读 2017-12-25 15:42 |个人分类:科研感悟|系统分类:科研笔记|关键词:P值| P值


几乎每篇文章都会出现P值。很多时候P值小于0.05就意味着某项科研的成功,大于0.05则意味着失败。但P值真的是万能的吗?对此,波士顿哈佛公共卫生学院的维克多·德·格鲁托拉(Victor De Gruttola)所说,P值0.05的选择实际上是一种命理学,没有科学的理由。


一个72人的科学研究组最近发声,指出研究者、资助机构以及出版社都在担心科研文章的可复制性。他们认为统计模型中的P值只是冰山一角,并不能作为认可或否认一项科研的唯一甚至重要依据。有些研究者在PsyArXiv上发文说,P值应该降至0.005。洛杉矶南加州大学的经济学家丹尼尔·本杰明(Daniel Benjamin)说:“当P值为0.05时,科研所得证据是相当弱的,P值在0.05到0.005之间也只应被视为“建议性证据”而不是确定的知识。假设研究有100%的能力来检测真实的效果,要求p值等于或低于0.005而不是0.05会产生更有力的证据:这会将假阳性结果从33%降低到5%。


然而,降低P值有可能增加阴性结果;比如实验结果表示药物不存在作用而事实是药物是起作用的,这样就会错过有用的发现。荷兰大学心理测量和统计的研究员们表示说,为了弥补这一缺陷建议增加70%的样本量,这样不仅可以避免误报率的增加,同时还能大大降低误报率。但他们也说实际上只有资金雄厚的科学家才有办法做到这一点。


然而,芝加哥伊利诺伊理工学院的计算机科学家则说,这个问题没有简单的答案,因为不管你选择什么置信区间,总有一种实验办法有可能碰巧得到显著的结果。同样,他也指出降低P值会导致很多阴性结果的科研文章都长眠于抽屉。当然,各学科对P值的看法也是不同的。对于收集来自原子粉碎实验的物理学家,他们在处理大量数据时,长期以来一直要求P值低于0.0000003(或3×10-7),因为担心较低的阈值可能导致错误的解读。其实十多年前,遗传学家采取了类似的做法,为全基因组关联研究建立了一个5×10-8的P值门槛,来寻找患者与那些变体患者之间的差异。


还有一些科学家已经放弃了P值,而倾向于更复杂的统计工具,如贝叶斯检验,这需要研究人员来定义和测试。不过,并不是所有的研究人员都有专门的技术来进行贝叶斯测试的。P值不万能,但还是可以用来衡量一个假设是否有证据支持的。P值本身也许没错,只是需要我们科研人员更加小心地利用。


您对P值的看法是什么呢?




更多精彩文章请造访英论阁官网【英论阁学术院】

---或关注英论阁微信公众号】(搜索enagocn或扫描下方二维码)---

§博客内容皆由英论阁资深学术专家团队撰写提供§



http://blog.sciencenet.cn/blog-681387-1091405.html

上一篇:究竟谁该被列为作者?——几种特殊的作者类型
下一篇:中国将组建六个国家级研究中心,共同推进科技创新

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-10-18 19:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部