|||
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小哈 来源:嘉因
60分万岁,多1分浪费
p-value = 0.051。。。。。。
场景一:做RNA-seq,做几次重复?应该做几次?发paper时认可几次重复?
场景二:RNA-seq做了3次重复,用p-value < 0.05筛出的差异基因太少,只用2次重复来筛,筛出了好多,好开森 ~ ~ ~
场景三:基因KO组跟对照组比,计算药物处理后表型是否有显著差异。做了3次实验,p-value > 0.05;继续做,做到5次重复,p-value < 0.05,好开森 ~ ~ ~
减少重复次数?增加重复次数?怎样是合理的?
来看看statQuest视频讲Power in statistics,需要几次重复能获得较低的p-value。
倒霉蛋儿不只你一个,增加重复次数会发生什么?
多做了重复后,30%的情况p-value降到0.05以下,make sense?NO!那叫假阳性
不可以为了获得好的p-value而增加重复,那会增加假阳性。
正确的做法是:
做实验之前,算一下到底需要多少样本量;
如果实验前没评估样本量,就评估之后重新开始做实验。
(你们这些做统计的不懂实验狗的忧伤)
怎样评估需要做几次重复呢?
实验前评估需要多少次重复,power calculation,受4个因素影响:
第4个是统计方法,最广泛应用的t-test有最强的power。重点考虑前三个因素:
最好是有前期数据或已发表的数据,有第六感也成:
如果没有前期数据和第六感,还有办法:
对于RNA-seq数据:
具体怎么算?
交给电脑算,点击左下角“阅读原文”直达G*Power网站。刚更新,17 July 2017 - Release 3.1.9.3,有Windows版本和Mac版本。用法简单:
你可能需要一些基础知识,搬来简洁易懂的statQuest视频。
one or two tail t-test的另一个视频
回到开头的场景,解决方案:
才不管怎么算呢,We always use 3 patients...
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 21:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社