||
因果学习工具:Causal Explorer和Causal Learner
在因果学习领域,识别因果结构(Causal structure)和马尔可夫毯(Markov blanket)是两个非常重要的研究点。其中,因果结构分为全局和局部两种,马尔可夫毯能有效应用于特征选择研究领域。按照定义,全局因果结构的有向无环图(directed acyclic graph,DAG)覆盖所有可能的变量(图1(a)),局部因果结构的DAG只关注目标变量T相关的变量(图1(b)),马尔可夫毯在局部因果结构基础上,还考虑了目标变量T的子节点的其他父节点(有点类似亲戚节点)(图1(c))。
图1 因果结构和马尔可夫毯示意图
在因果结构和马尔可夫毯识别方面,最早的工具是Matlab语言编写的Causal Explorer(2002年就发布了第一版),最新版本1.5在2019年发布,开源链接为https://github.com/mensxmachina/CausalExplorer_1.5。2020年,发布了另一个Matlab语言编写的工具:Causal Learner,开源链接为https://github.com/z-dragonl/Causal-Learner#readme。相比Causal Explorer,Causal Learner增加了数据模块和评估模块(图2),并且因果结构和马尔可夫毯识别的算法规模有所增加(图3)。
图2 Causal Learner工具架构
图3 Causal Learner与Causal Explorer在因果结构和马尔可夫毯识别算法方面的比较
在因果学习的实际应用过程中,可以交替使用Causal Learner和Causal Explorer来识别观察数据内蕴含的因果结构和马尔可夫毯。尤其是应用于高维观测数据时候,所需计算量将会很大,需要高性能和高配置计算设备支撑。值得注意的是,因果结构和马尔可夫毯识别只是构建DAG。对于连续型观察数据,如果要想知道变量之间的因果效应(Causal effect),还需要在因果结构和马尔可夫毯基础上,进一步使用do算子等计算出DAG内变量之间的因果效应。因果效应计算的实现工具包可参考R工具包pcalg(https://cran.r-project.org/package=pcalg)。
参考文献
[1] Statnikov A, Tsamardinos I, Brown LE, Aliferis CF. Causal explorer: A matlab library of algorithms for causal discovery and variable selection for classification. Challenges in machine learning. 2010 Jan;2:267-78.
[2] Ling Z, Yu K, Zhang Y, Liu L, Li J. Causal learner: A toolbox for causal structure and markov blanket learning. Pattern Recognition Letters. 2022.
以往推荐如下:
2. 因果推理综述推荐一篇
5. 你想了解因果推理吗?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 18:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社