||
话说线性方程组解的三状态:无解、唯一解、和多解(欠定),中学里边,咱们只管唯一解。但实际工作中常常遇到观测数目多于未知数目的情况。这时信息量常有富余,反而“无解”,显然傻逼。所以高斯大侠自创一招“无中生有满天星”剑法,充分利用数据信息冗余(满天星),硬找出一个抗噪声的最优解(无中生有)。高大侠这一招风行天下二百余年,国内最早翻成“最小二乘法”,其实 “最小平方误法”,更容易理解,就是在满天星斗的数据点集中,拟合出模型有最小平方误的一套参数,作为最优解。
总之,“超定”问题的求解,算是高大侠解决了。恼火的是欠定。欠定有明、有暗。明欠定比如说有三个方程,解4个未知参数,这一眼就可看出。暗欠定,就是说,看起来方程数等于或大于未知参数,但彼此不独立、或观测之间有相关,导致最小平方误法中的A’A(见前博文网友欧阳克评论)的不满秩。应用又需要我们定量遥感解出这些参数。这时怎么办呢?
办法1。既然既没有唯一解,又没有高大侠的最优解。这就是“死反演”,想治病,就是骗国家的钱,咱们别干了。
办法2。加观测数据,加成数据海洋都不怕,反正计算机快。
办法3。加限制条件,(加方程):比如端元丰度均为正且和为1,又如加最大熵,。。。
注意办法3实际上已经在用先验知识注入来“治病”了,但没有从理论上强调先验知识的重要性和规范其用法。做到这一点的是贝叶斯 贝大侠。
“贝叶斯提出了一种归纳推理的理论,以后被一些统计学者发展为一种系统的统计推断方法,称为贝叶斯方法.”——摘自《中国大百科全书》(数学卷)
贝叶斯是自学成才的英国数学家,1702- 1763,长期担任地方教堂的牧师. 1742年,贝叶斯当选英国皇家学会会员. 1758年,贝叶斯发表《论概率问题的求解》中,提出了一种归纳推理的理论,其中的“贝叶斯定理(或贝叶斯公式)”给出了在得到新的观测后,对所有原因(未知参数)计算其后验概率的公式,以后发展为一种系统的统计推断方法,称为贝叶斯方法.贝叶斯方法在理论上的进展以及它在应用上的方便和效益,在200多年为许多人所了解,认为贝叶斯方法是唯一合理的统计推断方法,形成数理统计学中的贝叶斯学派.
顺便说一句,贝叶斯方法是科学简单性原则的另一光辉例证。他只是把全概率公式AB=CD,改成A=CD/B,但赋予“先验知识”,新的观测,“后验知识”的含义,描述了知识积累与更新的过程。这样每一次新的遥感观测,就都能对待求参数的理解作新的贡献,而不管待求参数有多少个,只是新观测的信息分配的问题。这对于要求(A’A)必须满秩,是革命性的。
我们将贝叶斯方法用于定量遥感,是在90年代中,发表在《中国科学》上,国际上影响有限。加上些进一步工作,2001年发表在JGR上,反响是令人满意的。但我最满意的一点是,把我们先哲的教训,用英文推向国际定量遥感界:
Our knowledge consists of two parts: what we know, and what we know we don’t know.
但是要将贝叶斯方法用于定量遥感,必须有“先验知识库”的支持。因此必须有一些基本建设。863支持了我们的想法,但要求我们做到“高科技含量,低应用门槛”,不准出现“波谱知识库”、“病态反演”这类字眼,避免有人在概念上来纠缠,用户难以理解。重点项目指南出来之后,果然没人在概念上纠缠。但项目指南叫了“波谱数据库”,谁家里有一台波谱仪,都觉得该是自己牵头申请的项目,搞成了一场恶斗,害我得罪人。真是有一利必有一弊啊。
为了说清楚知识库和数据库的差别,一位德高望重的学长打了个比方:数据库就像字典,知识库就像辞典。我这里再回到“奚我后”。要查字典,后字非唯一解,还是看不懂。要查辞典,就连上下文一起,作为一个空间模式来查,输入“奚我后”到百度:
《奚我后》是著名画家徐悲鸿的经典油画作品。 该画构思于1931年,1933年完成。名字《奚我后》来自《尚书·仲虺之诰》:“奚我后,后来其苏。”《尚书》中“奚我后”又作“奚予后”,“等待我们的君主”之意。其背景是描写夏代末年...
这就叫知识库。(待续)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-14 11:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社