ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

欲哭无泪的p-value = 0.051 | 做几次重复能得到较低的p-value

已有 5995 次阅读 2017-12-15 14:12 |个人分类:RNA-seq|系统分类:科普集锦| RNA-seq


本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小哈   来源:嘉因

60分万岁,多1分浪费


p-value = 0.051。。。。。。




场景一:做RNA-seq,做几次重复?应该做几次?发paper时认可几次重复?


场景二:RNA-seq做了3次重复,用p-value < 0.05筛出的差异基因太少,只用2次重复来筛,筛出了好多,好开森 ~ ~ ~


场景三:基因KO组跟对照组比,计算药物处理后表型是否有显著差异。做了3次实验,p-value > 0.05;继续做,做到5次重复,p-value < 0.05,好开森 ~ ~ ~




减少重复次数?增加重复次数?怎样是合理的?


来看看statQuest视频讲Power in statistics,需要几次重复能获得较低的p-value。




倒霉蛋儿不只你一个,增加重复次数会发生什么?


多做了重复后,30%的情况p-value降到0.05以下,make sense?NO!那叫假阳性

不可以为了获得好的p-value而增加重复,那会增加假阳性。


正确的做法是:


  1. 做实验之前,算一下到底需要多少样本量;

  2. 如果实验前没评估样本量,就评估之后重新开始做实验。


(你们这些做统计的不懂实验狗的忧伤)






怎样评估需要做几次重复呢?


实验前评估需要多少次重复,power calculation,受4个因素影响:


第4个是统计方法,最广泛应用的t-test有最强的power。重点考虑前三个因素:

最好是有前期数据或已发表的数据,有第六感也成:


如果没有前期数据和第六感,还有办法:



对于RNA-seq数据:




具体怎么算?


交给电脑算,点击左下角“阅读原文”直达G*Power网站。刚更新,17 July 2017 - Release 3.1.9.3,有Windows版本和Mac版本。用法简单:


你可能需要一些基础知识,搬来简洁易懂的statQuest视频。

one or two tail t-test的另一个视频





回到开头的场景,解决方案:


才不管怎么算呢,We always use 3 patients...






https://blog.sciencenet.cn/blog-3372875-1089841.html

上一篇:用肿瘤组织做ChIP-seq、ATAC-seq + RNA-seq + DNA羟甲基化
下一篇:Ensembl、UCSC、Refseq,该用哪个
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 21:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部