求真分享 http://blog.sciencenet.cn/u/zlyang 求真务实

博文

[小思考,大困惑] 不能仅从一组时间序列分析得到因果性?

已有 3360 次阅读 2022-7-18 15:19 |个人分类:基础数学-逻辑-物理|系统分类:科研笔记

汉语是联合国官方正式使用的 种同等有效语言之一。请不要歧视汉语!

Chinese is one of the six equally effective official languages of the United Nations.

Not to discriminate against Chinese, please!

                                                            

[小思考,大困惑] 不能仅从一组时间序列分析得到因果性?

                   

一、什么是“因果性 causality”?因果性真的存在吗?

1.1  因果性

   原因指引起一定现象的现象,结果指由于原因的作用而引起的现象。

   一个事件(即“因”)和第二个事件(即“果”)之间的作用关系,其中后一事件被认为是前一事件的结果。又称因果关系。

   在现实世界中,人们早就发现一种现象的出现,总是由某种或某些现象引起的,而这种被引起的现象又会进一步引起另一种或一些现象的产生。在这里,引起某一现象的现象叫做原因,而被引起的现象叫结果。摩擦生热,前者就是原因,后者就是结果。

   一切事物和现象都处于普遍联系、相互制约之中。每一种现象都是由另一些现象引起的,同时,它又引起了另一些现象。一种现象对于被它引起的现象来说是原因,对于引起它的现象来说则是结果。事物、现象之间这种引起与被引起的关系就是因果关系。

   因果联系是多种多样、极其复杂的。现实中的因果联系往往不是一个原因产生一个结果,而更多地表现为一因多果、一果多因。

   因果关系是复杂、多样的,分类的角度也有多种,但从逻辑的角度可以将因果关系分为必然性因果关系与偶然性因果关系两种。

   因果关系及其推理在逻辑学中是一个未经深入研究的领域,还有许多东西值得探索。

                                   

1.2  对因果性的其它看法

   康德则认为,自然界本身不存在因果联系,因果联系只是人们整理感觉经验的一种先天的形式。

   马赫宣称:“原因和结果是我们思维的创造物”,“在自然界中,既没有原因,也没有结果”。

   上述哲学家的共同特点就是否认因果关系的客观性。

   德国著名科学家亥姆霍兹(Hermann von Helmholtz)(《生理光学》):因果律带有纯逻辑法则的特性……它只不过是一种对每件事都求得理解的需求。

   当代大数学家外尔在《数学与自然科学之哲学》(Hermann Weyl, Philosophy of Mathematics and Natural Science)中说:在构造实在世界时,我们强制要求因果律有效。

               

   简言之,上面的看法大意:因果律并非客观规律,只是一种信念,是为了思维的经济有效所做的主观预设。既然如此,因果律并非放之四海而皆准。

                                   

二、因果性的判断

(1)密尔五法  Mill's five methods in searching of causal connections

   感觉有用,也不是绝对可行(正确)的。

                                   

(2)格兰杰因果关系检验 Granger causality test

   格兰杰本人在其2003年获奖演说中强调了其引用的局限性,以及“很多荒谬论文的出现”(Of course, many ridiculous papers appeared)。由于其统计学本质上是对平稳时间序列数据一种预测,仅适用于计量经济学的变量预测,不能作为检验真正因果性的判据。

                                   

(3)Judea Pearl 三个因果层级

   请看:

   北京智源人工智能研究院,2020-06-23,图灵奖得主Judea Pearl 智源大会演讲:从“大数据革命”到“因果革命”,

https://www.sohu.com/a/403796321_120209831 

等。

                           

三、[小思考,大困惑] 不能仅从一组时间序列分析得到因果性?

3.1  判断因果性是个无限发展的过程

   一切事物和现象都处于普遍联系、相互制约之中。每一种现象都是由另一些现象引起的,同时,它又引起了另一些现象。一种现象对于被它引起的现象来说是原因,对于引起它的现象来说则是结果。事物、现象之间这种引起与被引起的关系就是因果关系。

   所以,不能仅从一组时间序列分析得到因果性。

      

   例如,“古气候定量重建”时:一步查明各种替代指标现代过程的物理机理,通过整合区域数据库获得更候环境梯度的信息,对不同指标定量结果互检,从野外调查、实验室培养观测等多途径对转换函数数理模型进行改进,尽可能降低定量重建误差和不确定性,是古气候定量研究的必然趋势。

                                   

3.2  反例:不能仅从一组时间序列分析得到因果性

   目的:

   下面,我想构造一个“科学”的实例(反例),证明不能通过一组(一套)时间序列(数据)来得到“因果关系”。

                 

   两个幅值为1,周期为1000数据点的正弦波,共计 6000点。这样,基本上可以不考虑置信区间引起的不确定性。

   固定第一个正弦波,另一个正弦波的相位从 0度变化到 360度。

   这两个正弦波之间的皮尔逊相关系数和欧氏距离的变化如下:

Correlation_Causation_DEMO_sine 11 Pearson.jpg

图1 皮尔逊相关系数随第二个正弦波相位的变化

                   

Correlation_Causation_DEMO_sine 22 Euclidean.jpg

图2 欧氏距离随第二个正弦波相位的变化

Correlation_Causation_DEMO_sine 22 Euclidean 反.jpg

图3 图2倒个个

                                   

   可见:相关性/距离是变化的,从中说不清楚是怎么回事。

  

   场景一:

   这两个正弦波来自两个国家:一个在非洲坦桑尼亚的达累斯萨拉姆大学(University of Dar es Salaam, Tanzania;另一个在我们天津大学。都是在各自的电工学实验室。两位同学在实验开始时调整示波器:示波器上显示的正弦波波形。

   结论:无论怎样,很难说这两个正弦波之间存在“因果关系”。尽管其皮尔逊相关系数 = 1,欧氏距离 = 0

   

   场景二:

   还是在电工学实验室。第一个正弦波是流过电容器的电流;第二个正弦波是该电容器两端的电压。之间刚好是严格的 90度“相位差”关系。

   这个世人皆知的“因果关系”[小思考,大困惑] 不能 ic=Cdudt.jpg,皮尔逊相关系数刚好 = 0;欧氏距离上没有明确的特征(0,极值之类)。

  

   结论:

   判断因果性,是个多场景、多变量(不同的物理性质、不同的化学性质、不同的生物性质等)、多信息等的综合判断问题。

   像格兰杰因果关系检验之类的方法,会不会遇到类似“聚类不可能定理 An impossibility theorem for clustering”之类的限制?

   there is no clustering function f that satisfies Scale- Invariance, Richness, and Consistency. 没有满足尺度不变性、丰富性和一致性的聚类函数 f

                          

   说明:除了“3.2 反例:不能仅从一组时间序列分析得到因果性”之外,大多数文字是抄袭来的。出处在下面列出的参考文献里。遗憾的是,少部分内容出处忘了。抱歉。感谢原作者和有关人员。

   其实,科普类文章是不太定义严格“抄袭”的。科普,核心是内容正确。

            

   洛伦兹(Edward N.Lorenz)的“蝴蝶效应”:“一只南美洲亚马逊河流域热带雨林中的蝴蝶,偶尔扇动几下翅膀,可以在两周以后引起美国得克萨斯州的一场龙卷风。”

   洛伦兹在美国,用了南美。我在中国,就用个非洲大学吧!

                                      

参考资料:

[1] 因果性/causality/朱复康,中国大百科全书

https://www.zgbk.com/ecph/words?SiteID=1&ID=235393&Type=bkzyb&SubID=59860

[2] 密尔五法/Mill's five methods/韩冬临,中国大百科全书

https://www.zgbk.com/ecph/words?SiteID=1&ID=111896&Type=bkzyb&SubID=99940

[3] 格兰杰因果关系检验,百度百科

https://baike.baidu.com/item/%E6%A0%BC%E5%85%B0%E6%9D%B0%E5%9B%A0%E6%9E%9C%E5%85%B3%E7%B3%BB%E6%A3%80%E9%AA%8C?fromtitle=%E6%A0%BC%E5%85%B0%E6%9D%B0%E5%9B%A0%E6%9E%9C%E6%A3%80%E9%AA%8C&fromid=16244809

[4] Granger Causality: Definition, Running the Test, Statistics How To

https://www.statisticshowto.com/granger-causality/

[5] Chapter 4: Granger Causality Test, Time Series Analysis Handbook

https://phdinds-aim.github.io/time_series_handbook/04_GrangerCausality/04_GrangerCausality.html

[6] Clive W.J. Granger, The Sveriges Riksbank Prize in Economic Sciences in Memory of Alfred Nobel 2003

https://www.nobelprize.org/prizes/economic-sciences/2003/granger/facts/

[7] 北京智源人工智能研究院,2020-06-23,图灵奖得主Judea Pearl 智源大会演讲:从“大数据革命”到“因果革命” 

https://www.sohu.com/a/403796321_120209831

[8] JUDEA PEARL - CAUSALITY

http://bayes.cs.ucla.edu/jp_home.html

[9] 古气候定量重建/quantitative reconstruction of paleoclimate/羊向东,中国大百科全书

https://www.zgbk.com/ecph/words?SiteID=1&ID=22288&Type=bkzyb&SubID=78204

   进一步查明各种替代指标现代过程的物理机理,通过整合区域数据库获得更候环境梯度的信息,对不同指标定量结果互检,从野外调查、实验室培养观测等多途径对转换函数数理模型进行改进,尽可能降低定量重建误差和不确定性,是古气候定量研究的必然趋势。

[10] Jon Kleinberg. An impossibility theorem for clustering [C]. Proceedings of the 15th International Conference on Neural Information Processing SystemsJanuary 2002: Pages 463–470.

https://dl.acm.org/doi/10.5555/2968618.2968676  

[11] 澎湃号·媒体,2022-02-10,【认识非洲 · 非洲大学纵览】达累斯萨拉姆大学简介

https://m.thepaper.cn/newsDetail_forward_16641324

   坦桑尼亚达累斯萨拉姆大学(University of Dar es Salaam)是坦桑尼亚历史最为悠久,也是该国目前规模最大的公立大学,在坦桑尼亚国内及整个东非地区具有较大影响力,

   达累斯萨拉姆大学现有7个校内学院(Campus College),分别涉及工程技术、信息与通信技术、自然与应用科学、人文学科、社会科学、农学与食品科技和医疗卫生;

相关链接:

[1] 2021-12-18,[资料汇集] 判断因果性

https://blog.sciencenet.cn/blog-107667-1317132.html

[2] 2013-06-30,《中国“科学网大学”逻辑基础研讨中心》活动之四:因果性与逻辑

https://blog.sciencenet.cn/blog-107667-703983.html

[3] 2020-07-20,[严肃内容] 鲁索(Rousseau)教授对皮尔逊相关系数实质认识的图示

https://blog.sciencenet.cn/blog-107667-1242781.html

[4] 2014-03-04,[请教] 相关系数和互信息之间的解析关系

https://blog.sciencenet.cn/blog-107667-773091.html

[5] 2021-08-03,[求证] 生成指定相关系数为 ρ 的两个正态分布随机数

https://blog.sciencenet.cn/blog-107667-1298177.html

[6] 2021-08-04,[资料搜集] 生成 n 个相关的高斯分布随机数

https://blog.sciencenet.cn/blog-107667-1298315.html

[7] 2022-06-23,往日(11)之二:比 Fisher Z Transformation 更好:细节与相关的历史资料

https://blog.sciencenet.cn/blog-107667-1344208.html

                   

感谢您的指教!

感谢您指正以上任何错误!

感谢您提供更多的相关资料!



https://blog.sciencenet.cn/blog-107667-1347796.html

上一篇:[小总结,崩溃] Zenas 公理:你什么时候失效啊!
下一篇:[找茬] 相关性与因果性:生命现象的多起源可能性
收藏 IP: 202.113.11.*| 热度|

13 王涛 檀成龙 许培扬 谢钢 孙颉 杨学祥 宁利中 刘钢 李宏翰 范振英 尤明庆 杜占池 郑永军

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-17 19:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部