||
通过交叉映射熵推断单细胞因果网络
从scRNA-seq数据中揭示基因调控网络(GRN)或机制对于理解细胞过程至关重要。细胞的GRN不仅调节大多数生物过程,如发育、稳态和疾病过程,而且还表征该细胞的转录状态。此外,对细胞中网络拓扑结构的了解实际上可以在网络水平上对这些过程的分子机制进行深入的理解。
随着高通量测序技术的快速发展,人们提出了许多推断GRN的方法。一般来说,这些GRN推理方法分为三类,即基于模型的方法、基于机器学习的方法和信息论的方法。基于模型的方法,如布尔网络方法和贝叶斯网络方法,可以通过拟合各种模型的基因表达谱来描述基因关联,具有很高的灵活性和可扩展性。GENIE3、GRNBoost2等基于机器学习的方法可以识别调控方向,得到有向网络。然而,这些方法都是基于线性模型或基于树的模型进行GRN推理,难以推广到更全面的非线性框架。信息论方法是推断GRN最常用的方法。然而,这些方法推断的GRN一般都是无向网络,这限制了其在实际生物网络中的应用。
为了解决这些问题,Li等人[1]提出了一种新的信息理论方法,邻居交叉映射熵(NME),用于可靠地估计变量之间的因果关系,并对稳态数据和时间序列数据推断有向GRN,克服了基于信息的GRN方法的局限性(图1A)。NME可以根据严格的数学框架,即连续性标度定律,通过改变相邻大小来量化两个变量之间的“连续因果关系”及其因果强度,这在逻辑上也符合函数依赖的自然解释。此外,作者们还将NME扩展到条件邻居交叉映射熵(cNME,图1B),以获得变量之间的直接因果关系。此外,利用scRNAseq数据中的网络信息,开发了基于NME/cNME的scNME,该方法可以识别稳定的细胞状态,并以鲁棒的方式准确地聚类细胞类型。scNME还可以通过GRN基质消除物种异质性,有效地对不同物种的细胞进行分组。此外,scNME可以用于识别新的细胞状态,并评估scRNA -seq数据集的GRN活性。作者们证明了NME在推断因果网络方面的能力,这可以进一步应用于网络水平上各种生物过程的下游分析(图1C)。NME可以在https://github.com/LinLi-0909/NME免费获得。
图1 NME算法框架。(A)用不同NN的邻居交叉映射熵(NME)量化的两个变量之间的因果关系示意图。X和Y是两个随机变量,有n个样本。使用基于连续性标度律或函数依赖的连续性来定义连续因果关系,用NMEX→Y量化函数的连续性来估计从X到Y的因果关系强度。如果X和Y之间存在因果关系,则从每个xi的NN近邻xiNN到Y的映射,即Y(xiNN),期望是xiNN的连续函数,Y(xiNN)是yi的NN近邻,Y(xiNN)是yi的NN近邻或与yiNN有高度重叠。随着NN的变化,NMEX→Y保持较高,这可以量化这种连续性或因果强度。另一方面,如果X到Y之间不存在因果关系,则从每个x_i的NN近邻xiNN到Y的映射,即Y(xiNN)与xiNN之间没有函数关系,如果在任意的情况下,Y(xiNN)是随机分布的或与yiNN有低重叠。因此,对于不同的NN, NMEX→Y总是趋近于0。(B)基于条件邻居交叉映射熵(cNME)的两个变量之间的直接因果模型。考虑有n个测量样本的第三个变量Z从X到Y的直接因果关系。(C) scNME工作流程示意图。scNME有三个主要步骤。1)利用cNME从scRNA-seq和TF数据集推断基因调控网络(GRNs);2)通过网络熵定义每个细胞的GRN活动(方法);3)基于GRN活动矩阵的聚类降维。因此,可以获得细胞状态特异性活性GRN和单细胞GRN
参考文献
[1] Li L, Xia R, Chen W, Zhao Q, Tao P, Chen L. Single-cell causal network inferred by cross-mapping entropy. Brief Bioinform. 2023 Aug 7:bbad281. doi: 10.1093/bib/bbad281.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 09:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社