|||
这是一篇关于因果确证的文章。发表于Entropy, 中英文见:
摘要:用统计数据比较两种原因对结果的影响时,如果我们得到的合并结论和分组结论相反,这被称之为辛普森悖论(英文是Simpson Paradox, 缩写为SP)。现在流行的因果推断理论(英文是Popular Causal Inference Theory, 缩写为PCIT)通过去混杂影响,使合并结论和分组结论一致,从而消除SP。PCIT使用相对风险差Pd=max(0,(R-1)/R)作为反映因果关系的概率(R=正例比例/反例比例),而哲学家Fitelson用确证测度D(D=后验概率-先验概率)评价因果关系强度。Fitelson得出结论:从贝叶斯确证理论看,我们无需考虑混杂影响,直接接受合并结论就行了。为了消除PCIT和贝叶斯确证之间的矛盾,作者使用语义信息方法推导出因果确证测度Cc=R-1)/max(R,1)。这一测度很像Pd, 但是具有归一化性质(在-1和1之间变化)和原因对称性(相反原因会使得确证度为负)。Cc特别适合原因抑制结果(比如疫苗抑制感染)的情况(确证度是负的)。文中提供的一些例子(关于肾结石治疗和COVID-19)表明Pd和Cc比D更加合理,Cc比Pd更加有用。Pd和Cc的合理性反过来支持了贝叶斯确证的归纳派。
关键词:因果确证;贝叶斯确证;因果推理,语义信息测度,交叉熵,辛普森悖论,风险测度
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 20:38
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社