zhaohai的个人博客分享 http://blog.sciencenet.cn/u/zhaohai

博文

从观测到预测

已有 555 次阅读 2024-4-7 08:39 |个人分类:思考点滴|系统分类:教学心得

(2013-11-26 09:18:26)

   昨晚在大学同学QQ群里听说吉林地震了,早上在中国地震网得到消息证实。2013年11月25日,也就是昨天22:09:39,位于东经124.1度与北纬44.7度的吉林省松原市前郭尔罗斯蒙古族自治县发生了一次地震,震级深度6公里,强度4.0级。当清晨第一缕阳光爬上窗台的时候,万柳塘湖水已经开始结冰了。常言道:“冰冻三尺非一日之寒”,半冰半水的湖面仿佛就是一锅粘稠的粥,靠近岸边要比湖心更见周密。 

    曾记得,吾第一次体认地震是上个世纪八十年代的海城地震,傍晚全家在南炕上吃饭,仿佛链轨式拖拉机从窗前驶过。爸爸大叫“地震”,当时吾甚至都不知道地震是什么意思就已经体认那自然的力量。接下来就是唐山地震,吾有机会组织并参加抢救人员培训,直至今日吾才知道,原来上帝是通过这种方式让吾开始知汝自己的。

    吾接受的是中国式九年一贯制教育,八年级时选择了“地震监测专业”,每周观测深井中的仪表,记录一些探测点的数据。说句心里话,当时吾只是应付时间和任务而已,没有想到四十年后又会再计算地震。地震可以被观测,但是地震可以计算吗?地震可以预测吗?地质学家认为,预测是对地震发生的可能性描述,其时限较长,所以地震不可能被预言,但是可以被预测。

    古登堡·里克特法则认为,地震级别与发生频率之间的关系相对简单,震级升高时地震发生的频率则会大大降低,并且震级与频率呈现出幂律分布特征。然而,古登堡·里克特法则并没有告诉吾人,地震会在什么时候、什么地方、以什么级别发生。地质活动之周期大约几百年至几千年,人类之寿命不过几十年至百年,《庄子·养生主》云:“吾生也有涯,而知也无涯,以有涯随无涯,殆矣。已而为知者,形而已矣。”所以,单纯的数据记录是无法做出预测或者转换为吾人之指南。

    在通信原理中,将噪声误认为信号的行为被称作“错误信号”,导致信号分析错误;在图像处理中,将噪声误认为信号的行为称作“识别误差”,导致图像恢复错误;在统计学中,将噪声误认为信号的行为被称为“过度拟合”,导致态势预测错误。毫无疑问,科学文献或学术论文里将噪声误认为是信号的倾向,必将给现实世界带来极其可怕的后果。

    拟合之方法源于统计模型与过去观测结果之吻合程度,所以过于粗略地拟合会导致错过本来可以捕捉到的信号。拟合过于紧密则意味着对数据中的噪声在进行拟合,而不是挖掘数据更深层次之结构。当数据相对有限时,就可能陷入“过度拟合”的麻烦之中。然而,在无法获知数据的理想模型中,拟合就会变得非常贪婪。边缘数据点在曲线的上下抖动越是剧烈,拟合的结果离真实情况也就越远,预测也就更加离谱。

    为了了解数据之深层次结构,往往使用归纳法从已知的证据中对其结构进行推断。当数据有限又充满噪声时,由于不了解其基本关系或原理,也就更可能对一种模型做出“过度拟合”。表面效果非常之好与实际性能十分糟糕,是“过度拟合”所表达出来的双重错误,最终过度拟合模型一定会让预测者付出沉重的代价。如果模型是完全由噪声拟合出来的,那么就更有可能阻碍科学之发展了。毫无疑问,吾人会越来越迷恋于这种模型的诱惑,甚至会创造出一套貌似很有说服力的理论来证明这些错误的合理性,从而达到“自欺欺人”的目的。

    人类非常容易被“随机性愚弄”,因为吾人喜欢用怀疑主义来平衡好奇心,“过度拟合”就是由贪、嗔、痴、慢与邪见而生出的人类好奇心之产物。吾人常常通过“预测过去”来建立模型,再通过模型来“预测未来”。误差就是可以纠正的错误,错误就是不能纠正的误差。观测就是要看到不可预测的事物,预测就是要观测不可观测的东西。

    吾109小组从暑假开始用网络科学来研究地震现象,身带利器初来咋到,敏感性极强。复杂网络、作用域、贝叶斯网络,地震现象是一个复杂过程,尽管吾人常常将复杂与混沌理论混为一谈,但是二者之间是存在着相当的差异。复杂理论认为,当简单事物彼此相互作用时就会表现出神秘怪异,而神秘怪异就会产生错综复杂。混沌理论则认为,众多或者大量彼此相互联系或影响,无形的连结就会产生初始敏感,并且拓扑可以复制,最终造成周期点上的周密或者收敛。

    吾研究互联网宏观拓扑结构之规律已经十年有余了,路上往往有人会问:“为什么是宏观拓扑还结构呢?”常言道:“距离产生美”,混乱才会消魂,秩序方能平静,佛云:“时间可以美化一切”,当汝远离复杂从外边看去,复杂就会呈现出一种秩序之美。

    地球上没有了森林可以有煤炭,没有了煤炭可以有石油,没有了石油还可以核能,没有了核能再可以有太阳能,没有了太阳能更可以有……,但是如果没有了时间,吾人也就立刻什么都没有了。距离对时间的一阶导数是速度,距离对时间二阶导数是加速度,距离对时间的三阶导数是速度的加速度。从观测到预测,什么是人类最稀缺而又最容易被忽略的资源?答案不别的什么,而恰恰是时间。



https://blog.sciencenet.cn/blog-36125-1428505.html

上一篇:贝叶斯网络
下一篇:眼(耳鼻舌身意)
收藏 IP: 175.169.12.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-23 08:58

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部