zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

DEPower:使用 DESeq2 进行近似功效分析

已有 265 次阅读 2026-2-26 10:10 |个人分类:科普|系统分类:科普集锦

DEPower:使用 DESeq2 进行近似功效分析 

差异表达(DE)分析是转录组工作流程中普遍的一部分。在典型场景中,此类分析涉及构建一个统计模型来描述观测到的基因表达,该模型编码具有生物学意义和偶然性的协变量,例如扰动和实验批次的影响,拟合模型,并执行一系列零假设统计检验,以识别在所测试的协变量之间存在显著、大幅度表达差异的基因。有多种方法可用于执行 DE 检验,但 DESeq2 是一种最初于 2014 年发表的软件方法,它特别广泛使用,并被认为是基于计数的批量和单细胞转录组分析的一种合理方法,有大量文献探讨其优点和注意事项。 

通常人们感兴趣的是估计检测特定幅度差异所需的实验样本量。尽管已有大量研究和软件包提供相对复杂的数值解来解决这个问题,但分析性处理却很少,而且我们不知道有任何专门针对 DESeq2 所用模型的。这有些令人惊讶,因为样本量、效应大小和统计显著性之间的近似关系可能是从这个模型中推导出的一个基本结果。最近的简短文稿中,Gorin等人试图填补这一空白,并提供了一个用于执行此分析的网页应用DEPower(图 1ahttps://poweranalysis-fb.streamlit.app/)。该方法通过将离散度约束在表达水平上合理的范围内来整合 DESeq2 模型(图 1b),从而产生与完整 DESeq2 分析一致的检验统计量(图 1c)和 p 值(图 1d)估计。通过根据这些假设条件进行逆向计算,作者们确定了相应的样本规模范围。 

image.png

1 计算流程、实现及其与 DESeq2 流程的比较。a. 基于网络的计算器界面(左:用户定义的输入;右:计算得到的样本大小和支持性可视化)。b. 方差/表达关系(点:由 PyDESeq2 推断的方差;蓝色曲线:基于数据由 PyDESeq2 推断的全基因组方差曲线;红色线和区域:启发式程序估计的合理方差曲线和区域)。c. 启发式程序推导的中间统计量与 PyDESeq2 之间的关系(点:使用 a 中红色线指示的典型曲线获得的统计量;误差线:a 中区域上下界之间获得的统计量范围;红色线:一致性)。d. 启发式方法得到的 p 值与 PyDESeq2 之间的关系(点,顶部:使用 a 中红色线所示的典型情况曲线获得的 p 值;误差线,顶部:a 中区域上下界之间获得的 p 值范围;点,底部:使用 PyDESeq2 离散度估计得到的值;左侧:名义 p 值,越低越显著;右侧:-log 名义 p 值,越高越显著;红线:一致;品红色线:α = 0.05 

参考文献

[1] Gennady Gorin, Deek Guruge, Linda Goodman. DEPower: approximate power analysis with DESeq2. bioRxiv 2026.02.05.704084; doi: https://doi.org/10.64898/2026.02.05.704084 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源

38. LncPepAtlas:探索lncRNA翻译潜力综合资源

39. SPATCH:高通量亚细胞空间转录组学平台

40. MirGeneDB 3.0miRNA家族和序列数据库

41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

42. CircTarget:多种细胞类型circRNA调控综合数据库

43. GreenCells:植物lncRNA单细胞分析资源

44. RM2Target 2.0RNA修饰的写入者、擦除者和读取者靶基因数据库

45. SDMap:空间药物扰动图谱数据库

image.png

 



https://blog.sciencenet.cn/blog-571917-1523459.html

上一篇:cspray:分布式单细胞转录组分析
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2026-2-27 04:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部