||
克服同步性和间接效应困扰的一种通用因果推理方法
确定因果相互作用对于理解自然界系统的潜在机制至关重要。最近使用先进技术的时间序列数据收集的激增为计算揭示因果关系提供了机会。各种无模型方法,如格兰杰因果关系(GC)和收敛交叉映射(CCM),已被广泛用于从时间序列数据中推断因果关系。虽然它们很容易实现并且广泛适用,但它们通常很难区分广义同步(即组件之间的相似周期)与因果关系,以及区分直接和间接因果关系。例如,当给出振荡时间序列数据时,几乎所有连接的网络都被推断出来。为了防止这种假阳性预测,无模型方法已经得到了改进(例如,部分交叉映射(PCM)方法),但需要进一步的研究来证明它们的普遍有效性。
或者,基于模型的方法通过使用各种方法(如模拟退火和卡尔曼滤波器)的机制模型测试时间序列数据的可重复性来推断因果关系。虽然测试再现性在计算上是昂贵的,但只要底层模型是准确的,基于模型的推理方法即使在时间序列中存在广义同步和间接效应的情况下也是准确的。然而,推理结果强烈依赖于模型的选择,而不准确的模型施加可能导致假阳性预测,限制了它们的适用性。为了克服这一限制,开发了使用灵活模型的推理方法。特别是最新的方法ION,它是用两分量之间的一般单调ODE模型描述的从X到Y的一般单调ODE模型。但是,ION仅适用于每个组件最多受另一个组件影响的情况。
最近,Park等人开发了一种基于模型的方法来推断由一般单调ODE模型描述的多个组件之间的相互作用。该方法很大程度上解决了基于模型的推理的基本限制:对所选模型的强烈依赖。与以前基于模型的方法不同,它不需要计算昂贵的拟合。为了方便,他们开发了一个用户友好的计算包,GOBI(General ODE-Based Inference,https://github.com/Mathbiomed/GOBI)。GOBI成功地从同步时间序列数据中推断出基因调控网络、生态系统和空气污染引起的心血管疾病的因果关系,而流行的无模型方法无法推断出这些因果关系。此外,即使在嘈杂的时间序列数据中,GOBI也可以区分直接和间接因果关系。由于GOBI既准确又广泛适用,这是以前的无模型或基于模型的推理方法所无法实现的,因此它可以成为理解复杂动力系统的有力工具。
与无模型方法(GC、CCM和PCM)比较,GOBI能够有效消除同步性和间接效应影响(图1)。
图1 无模型的方法,而不是GOBI,由于同步和间接效应的存在而产生错误的预测。a - d将GOBI和流行的无模型方法(即GC, CCM和PCM)应用于从与遗传振荡器合并的捕食-捕食系统中获得的各种实验时间序列数据; (a) 压缩震荡;(b) pS2启动子的辅因子;(c) 空气污染物和心血管疾病;(d)对于空气污染物和心血管疾病数据,对三年的数据(灰色)和两年的数据(紫色)进行了测试
参考文献
[1] Park SH, Ha S, Kim JK. A general model-based causal inference method overcomes the curse of synchrony and indirect effect. Nat Commun. 2023 Jul 24;14(1):4287. doi: 10.1038/s41467-023-39983-4.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 13:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社