登高望远分享 http://blog.sciencenet.cn/u/qsqhopeiggcas 天马行空,寻求真谛

博文

为何理论预测模型失灵? 精选

已有 7357 次阅读 2022-7-2 17:43 |个人分类:建言献策|系统分类:科研笔记

前几天,我看到张学文先生在杨正瓴先生一篇博文下的评论(略有修改):“我只能说上世纪我曾经学习XXX的统计相关方法,经过自己分析,我确实发现某两个变量具有正相关,可以用于长期预告。我这样做了预告,可预告都失败了。后来我理解到完全无关事物的大量统计,也会出现一定数量的伪预告公式。...原来是自己的统计知识不够。”考虑到不少人士曾遭遇这样的问题,我觉得有必要写一篇博文谈谈自己的粗浅看法,以起到抛砖引玉作用。

理论模型一般分为统计模型和物理模型。

在认识不清某事物演变机理的情况下,人们不得已基于观测数据,采用回归、AI等统计方法建立预测模型,以达到预测未来之目的。然而,数据质量及其时空属性、统计方法选择的人为性、模型的非确定性等,严重影响预测结果的可靠性。如果预测时步较短,或能得到较好的结果,但不过是巧合耳;反之,则可能令人大失所望。

为便于理解,举一个例子(图1,蓝色曲线表示真实的y-t关系,其可由透彻的研究来确定)。如果张三利用A点和B点间的数据,则能得到y-t的统计正相关关系;李四利用C点和D点间的数据,则能得到y-t的统计负相关关系。然而,这两种关系都不能可靠地表征真实的y-t关系。由此,不同的人士据不同的关系会导致无休止的争论;不管争论的结果如何,其实都毫无意义,因为皆如“盲人摸象”一样。再者,不管根据那种关系预测未来某一时间ty值,当t较大时难免出现较大误差,甚至预测的变化趋势与实际截然相反。


1 y-t关系

如果某人基于某事物演变的物理机制,建立物理模型预测未来,预测结果的可靠性就能大幅提升。显然,对物理机制认识的越清,建立的物理模型越扎实,预测结果就越可靠。换句话说,谁真正掌握了物理机制,就相当于谁知道了图1所示的yt变化规律;据此建立扎实的物理模型,用之预测事物的未来演变状态会出现误差,但不会大,更不可能出现趋势相反的情况。

真正掌握某事物演变的物理机制——物理现象的内禀产生机制,难度极大,因为我们面临的大都是“黑箱系统”。要真正掌握之,不能仅基于室内实验和野外观测数据的统计分析做推断,因为此种推断(见上述)具有强非确定性;最有前途的是,靠思想实验和数据的结合。譬如,爱因斯坦基于思想实验,认识到引力源于质量造成的时空弯曲;他对引力物理机制的这一正确认识,奠定了广义相对论的基础;他提出的该理论,后被大量观测结果所证实。

我在2019年写的一篇博文中指出:“预测事物未来的演变行为,须在掌握其演变机制和规律的前提下,以科学理论和方法为指导进行。能可靠预测未来是人类科研活动的最高境界,但大多数学科目前的科研还停留在现象描述阶段或内禀机制的粗浅认识阶段,不具有预测事物未来演变行为的能力。”为深化认识内禀机制,诸君应苦干、实干加巧干。

相关:

2022年度国基项目评审感受

https://blog.sciencenet.cn/blog-575926-1341241.html

何谓科技创新活动中的首要“妙手”?

https://blog.sciencenet.cn/blog-575926-1342141.html



https://blog.sciencenet.cn/blog-575926-1345578.html

上一篇:科研追求:做一名特立独行的学者
下一篇:简谈实验结果的外推能力
收藏 IP: 202.62.115.*| 热度|

15 杨正瓴 檀成龙 卜令泽 苏德辰 宁利中 王涛 胡大伟 黄河宁 张俊鹏 张学文 晏成和 郑永军 周忠浩 谢钢 袁贤讯

该博文允许注册用户评论 请点击登录 评论 (20 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-19 19:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部