||
差异表达分析:经典方法未必逊色于流行方法
差异表达一般指基因在不同组别(例如实验组vs对照组)内的表达水平具有显著性差异,该分析是转录组数据的常规步骤之一。目前,针对转录组数据,差异表达分析工具有DESeq2、edgeR、limma-voom、NOISeq、dearseq、t-test和Wilcoxon rank-sum test等。其中,DESeq2、edgeR和limma-voom是大家最常用的差异表达分析工具。
然而,最近一项研究发现,两种流行的差异表达分析方法(DESeq2、edgeR)翻车了,因为它们出乎意料的具有高假阳性率。令人惊讶的是,经典方法Wilcoxon rank-sum test在众多比较方法之中反倒表现得最优(图1)。
图1 差异表达分析方法比较
特别地,即使DESeq2、edgeR的FDR设置为5%,但是这些方法的真实FDR有时候居然大于20%。通过在多个数据集中的比较研究发现,当应用于大样本量的转录组数据时,应该优先选择Wilcoxon rank-sum test。详细分析结果可以阅读图2所示的相关文献。
图2 相关文献
后话
目前,做差异表达分析时,习惯性的选择DESeq2、edgeR和limma-voom。下次做差异表达分析时,可以考虑Wilcoxon rank-sum test方法,尤其应用于较大样本的转录组数据。
参考文献与链接
[1] Li Y, Ge X, Peng F, Li W, Li JJ. Exaggerated false positives by popular differential expression methods when analyzing human population samples. Genome Biol. 2022;23(1):79. Published 2022 Mar 15. doi:10.1186/s13059-022-02648-4
以往推荐如下:
1. 因果推理综述推荐一篇
2. 生物学家的机器学习指南
3. 基础模型的机遇与风险
4. 一份单细胞数据分析教程
8. 国外知乎:Quora
11. 预印本知多少?
14. mRNA表达无法取代蛋白质表达
15. scIB:单细胞数据融合基准框架
16. 临床医疗维修店铺
18. 怎样做好一项研究?
19. 怎样做开题报告?
20. 深度学习助力单细胞数据分析
21. Any RNA
22. 走进数据科学
23. 直抵自闭症核心
24. 癌症内RNA
25. 一对搭档:计算与生物
26. TF靶标
27. 生物组织内细胞通讯
28. 记一次主题编辑经历
29. 6个,10个,14个......
30. 你健康吗?
31. 你衰老了吗?
32. scIMC:填充单细胞转录组数据缺失值
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 12:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社