zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

通过交叉映射熵推断单细胞因果网络

已有 1468 次阅读 2023-10-2 08:58 |个人分类:科普|系统分类:科普集锦

通过交叉映射熵推断单细胞因果网络 

scRNA-seq数据中揭示基因调控网络(GRN)或机制对于理解细胞过程至关重要。细胞的GRN不仅调节大多数生物过程,如发育、稳态和疾病过程,而且还表征该细胞的转录状态。此外,对细胞中网络拓扑结构的了解实际上可以在网络水平上对这些过程的分子机制进行深入的理解。 

随着高通量测序技术的快速发展,人们提出了许多推断GRN的方法。一般来说,这些GRN推理方法分为三类,即基于模型的方法、基于机器学习的方法和信息论的方法。基于模型的方法,如布尔网络方法和贝叶斯网络方法,可以通过拟合各种模型的基因表达谱来描述基因关联,具有很高的灵活性和可扩展性。GENIE3GRNBoost2等基于机器学习的方法可以识别调控方向,得到有向网络。然而,这些方法都是基于线性模型或基于树的模型进行GRN推理,难以推广到更全面的非线性框架。信息论方法是推断GRN最常用的方法。然而,这些方法推断的GRN一般都是无向网络,这限制了其在实际生物网络中的应用。 

为了解决这些问题,Li等人[1]提出了一种新的信息理论方法,邻居交叉映射熵(NME),用于可靠地估计变量之间的因果关系,并对稳态数据和时间序列数据推断有向GRN,克服了基于信息的GRN方法的局限性(1A)NME可以根据严格的数学框架,即连续性标度定律,通过改变相邻大小来量化两个变量之间的连续因果关系及其因果强度,这在逻辑上也符合函数依赖的自然解释。此外,作者们还将NME扩展到条件邻居交叉映射熵(cNME,图1B),以获得变量之间的直接因果关系。此外,利用scRNAseq数据中的网络信息,开发了基于NME/cNMEscNME,该方法可以识别稳定的细胞状态,并以鲁棒的方式准确地聚类细胞类型。scNME还可以通过GRN基质消除物种异质性,有效地对不同物种的细胞进行分组。此外,scNME可以用于识别新的细胞状态,并评估scRNA -seq数据集的GRN活性。作者们证明了NME在推断因果网络方面的能力,这可以进一步应用于网络水平上各种生物过程的下游分析(1C)NME可以在https://github.com/LinLi-0909/NME免费获得。 

image.png 

1 NME算法框架。(A)用不同NN的邻居交叉映射熵(NME)量化的两个变量之间的因果关系示意图。XY是两个随机变量,有n个样本。使用基于连续性标度律或函数依赖的连续性来定义连续因果关系,用NMEXY量化函数的连续性来估计从XY的因果关系强度。如果XY之间存在因果关系,则从每个xiNN近邻xiNNY的映射,即Y(xiNN),期望是xiNN的连续函数,Y(xiNN)yiNN近邻,Y(xiNN)yiNN近邻或与yiNN有高度重叠。随着NN的变化,NMEXY保持较高,这可以量化这种连续性或因果强度。另一方面,如果XY之间不存在因果关系,则从每个x_iNN近邻xiNNY的映射,即Y(xiNN)xiNN之间没有函数关系,如果在任意的情况下,Y(xiNN)是随机分布的或与yiNN有低重叠。因此,对于不同的NN, NMEXY总是趋近于0(B)基于条件邻居交叉映射熵(cNME)的两个变量之间的直接因果模型。考虑有n个测量样本的第三个变量ZXY的直接因果关系。(C) scNME工作流程示意图。scNME有三个主要步骤。1)利用cNMEscRNA-seqTF数据集推断基因调控网络(GRNs);2)通过网络熵定义每个细胞的GRN活动(方法);3)基于GRN活动矩阵的聚类降维。因此,可以获得细胞状态特异性活性GRN和单细胞GRN 

参考文献

[1] Li L, Xia R, Chen W, Zhao Q, Tao P, Chen L. Single-cell causal network inferred by cross-mapping entropy. Brief Bioinform. 2023 Aug 7:bbad281. doi: 10.1093/bib/bbad281. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

image.png




https://blog.sciencenet.cn/blog-571917-1404445.html

上一篇:基因调控网络中的因果关系推理探讨
下一篇:SARS-CoV-2感染的临床信息microRNAs
收藏 IP: 39.128.54.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 09:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部