YESC的个人博客分享 http://blog.sciencenet.cn/u/YESC

博文

从信息论到认识过程的数学理论--11

已有 2027 次阅读 2016-12-16 10:49 |个人分类:科研回忆录|系统分类:科研笔记

  与此密切相关的多个学科的理论研究中应用的问题,也可以列入‘人类认识量化理论’研究的扩展范畴。为了解释灰模型所揭示的概率向量的变化形式,必须推广哥氏概率空间。通过研究、建立灰元、灰事件及灰代数,可以建立适用范围更加广泛的“广义概率空间”。从而使时变概率向量、随机概率向量以及它们所对应的灰色概率向量,能够有机地衔接起来。把信息论中的有关概念及数学模型,推广为灰信息、灰色信源、随机概率信源、广义信源熵及灰信道等,只是针对一般被研究对象的认识问题;并不包括语言型通讯系统。在这类系统中应用,反而使问题复杂化。为什麽要提出“灰色信源”,只是因为确实存在着认识不充分的被研究对象。但是对于通讯系统,“灰色信源”的提法是不恰当的。“灰色信源”也就是认识不充分的信源,说它们是灰色的,也就是对拟人化‘信宿’所能够认识的信源而言的;也可以说这种‘灰色性’是相对的。对于一般的被研究对象,研究者都是以破解其内部机制、变化规律等为研究目标。提出“灰色信源”,可以使这类认识过程定量化、形式化;便于使用计算机处理信息提取问题。这类被研究对象或客体的认识过程模型是灰色的,因为只能依据所获得的测试信号样本去估计它。有些被研究对象也可能完全不被研究者所知,但我并没有提出‘黑色信源’的概念,主要是避免产生‘不可被认识’的误解。尽管我早就知道“黑洞”的一些性质已经被认识,但还是认为不提出‘黑色信源’为好。《信息学原理——关于认识的数学理论》所讨论的问题,是围绕人类认识的数学理论这条主线进行的;许多后续研究可能会更有意义,甚至会有意想不到的效果。对于密切相关的信息提取、语义理解、白化度、客观度、信息散失度等问题,在专著中讨论较多。但对于信息语义理解的讨论,并没有涉及到其实现问题,对实现灰模型等问题的算法也没有进行讨论。主观原因是我已面临退休;客观原因是来不及形成研究梯队、经费短缺。这本著作及有关研究论文,也只是搭建了一个理论框架;许多问题还有待于进一步深入研究。

 所涉及的主要方向如下:

1、灰系统辨识的有效计算方法:要建立灰系统的数学模型,关键是其输入、输出的样本如何获取、样本的最佳容量以及快速、有效的辨识算法。该样本的组成,对于灰系统数学模型及其白化度、客观度等都有重大影响。这些问题的真正解决,才有可能广泛应用。

2、灰系统辨识中,对非线性信息的提取和理解:灰系统辨识中所揭示的非线性信息,也只是与该系统有关的一些主要平衡点。如果系统辨识所采用的差分形式在其“邻域”中成立,如果辨识后只得到一个参数向量(即只有一个平衡点),则该系统就是线性的;所得到的差分方程自然就是该系统的数学模型。对于辨识获得多个参数向量(即多个平衡点)的情况,则该系统是非线性的。系统辨识所得到的每个差分方程,都可以看成该系统的非线性模型在对应平衡点邻域中的线性化形式。如果进一步研究这些这些平衡点之间的关系、以及各近似差分方程的适用范围,可能会有助于提取该系统更多的非线性信息。

3、时变概率向量的函数形式、随机概率向量的概率分布的应用研究:只要消息样本的容量足够大,即可在“普适灰结构”框架下被估计出来。对于时变概率信源及随机概率信源应用的深入研究,可能将有益于保密通信的密码编制或者破译。

4、对信息语义理解的研究,可以揭开人脑思维的神秘面纱:而信息语义的实质性理解,是有可能利用人工神经网络来实现的。把“突触”这种记忆单元的数学模型抽象为“滤波器”,而且各“突触”不同的滤波稳定性、可重复性,即表示它们记忆着“上层语义”的不同识别特性。该神经元所有输入“突触”所记忆的识别特性,就是其“上层语义”的解释语义。而其“上层语义”又作为该神经元的输出,被记忆在其“轴突”所连接的更上一层神经元的输入“突触”上;如此等等。对于信息语义的理解,都是在脑神经网络所记忆的知识系统中进行的。对于知识的记忆,则是脑神经网络的整体行为;也可以看成一种自下而上逐级解释(即再认)的行为。而神经元各输入“突触”的不同滤波特性,可能就是所记忆内容对应的输入信号、以其所特有的刺激频率而造成的。以前的研究者发现了神经元各输入信号的电平相同,但对该神经元兴奋的贡献电平却各不相同;从而提出了“加权、求和”而产生兴奋输出电平的论断。这种论断也可以算作这种多输入、单输出系统的一种数学模型。但“加权、求和”只是一种‘拟人化’机制,没有涉及神经细胞的记忆机制;不可能是神经元的真实作用机制。神经元的各输入电平相同,但经过各自的“突触”后降低为不同的贡献电平值;只能说明各“突触”具有“滤波器”的作用。我认为“滤波、叠加”而产生兴奋输出,才可能是更接近于神经细胞真实作用机制的功能模型。这种功能模型比前述“加权、求和”模型更加合理,至少除去了神经元的‘拟人化’色彩。在那本专著中,并没有详细讨论“突触”滤波特性形成的原因。因为当时还没有找到充分的证据,来证实我的推猜。现在是写回忆录,自然少了许多严格的限制;而且这些“推猜”可能会对后人研究、实现人工神经网络有所启示。我认为“突触”滤波特性是在长期的认识过程、学习过程中逐渐形成的,遗传也起着重要的作用。“突触”很可能本身就具有一种抑制电信号通过的作用,其‘抑制’作用可能会随着输入信号通过频率值而改变。输入信号通过的平均频率越高、越稳定,其‘抑制’作用就下降越多,对相应输入信号的衰减也就越少。久而久之,就使各“突触”形成了不同的滤波特性。而遗传的作用,就是把上一代进化所形成“突触”滤波特性的基因,遗传给他们的下一代。这种遗传作用并非简单的套话,也不是空穴来风;而是我在学习自组织理论、分子遗传学时的感悟。简而言之,那就是在一定环境下,DNA决定着机体组织的形成过程;正如光子只能在原子核环境下生成那样。反过来机体组织的变化,也会使DNA的作用、甚至组织结构产生改变;动物的变异就是佐证。所以我认为神经元各“突触”的滤波特性一旦形成,总会有一些人的DNA产生了相应的突变,而遗传给他们的后人。这些人在学习、认识客观世界时,无疑更有优势。进而就是自然选择在起作用,使人类的神经细胞进化成现在的这种状态。我提出的“滤波、叠加”的神经细胞功能模型、“突触”滤波及其形成机制的“推猜”,将可能会有助于人工神经网络的研制。如果人工神经网络的研究中,能够实现在人工神经网络上重构神经元‘抑制’作用、滤波特性的形成过程的“推猜”,就有可能在人工神经网络上实现自学习机制等关键环节上取得突破。从而就有可能使用人工神经网络,来实现人脑的信息提取、语义理解、语言表达等方面的功能。不断使之更加接近于人脑在这些方面的响应、再认过程,最终就有可能促使模拟人脑的人工神经网络计算机的成功研制。

5、在广义概率空间框架下,对随机过程的深入研究提供了新的可能性:对于非平稳随机过程的研究,无疑将会有助于降低这类特殊被认识对象在提取信息及理解信息方面的难度。有些学者难以挣脱研究的困境,甚至采取了回避“非平稳随机过程”提法的态度。广义概率空间的提出,可能会有助于减少、甚至解决这些研究的困难。不过研究“非平稳随机过程”,实在需要极大的勇气!也可能会使研究者辛苦终生,却劳而无功。我在开始研究人类认识量化理论时,也是从这种处境挣脱出来的。所以这并非危言耸听,而是要研究者必须具有“投之亡地然后存,陷之死地然后生”的精神;这也是我的亲身体会。

6、对于自然科学各学科所进行的实验,能够依据他们所获得的主要样本、数据等素材,定量判断其所获得结论的客观真实程度:科学各分支的研究对象、研究方法、实验方法,虽然各不完全相同、各具特色;但有一点是相同的,那就是都必须从被研究对象的现象、实验数据中提取信息、理解信息。按照各学科中通用的做法,就是依据有关“先验知识”提出假设,然后进行实验验证。实际上这些学科中,也存在如何定量判断其客观真实程度的问题。因为这种验证结论,也只是与“先验知识”框架下所作假设的推论相符合,并不能证明它完全符合客观实际。数学理论的验证方式则不同,并不是直接的实验验证;而决定其生死的关键,就是它能否在各学科中得到广泛的应用。数学理论在尚未获得应用前,也只是在一定假设下的逻辑推理结果。逻辑的真、假,对于它‘能、否存在下去’帮不了多少忙。能够获得广泛应用,才是它最终成功的验证方式。不能因为没有直接的验证数据,就把它划出科学范畴。其验证方式的有关信息,也正是间接地来源于所应用学科的实验验证之中。更何况逻辑推理、关系的源头,也正是认识过程;它们从认识过程中所提取出来的精华。如果能够依据科学实验数据的样本,计算出所提取信息的白化度、客观度及信息散失度,就可能判断其结论或者其验证的可信程度。由于不同学科的实验方式不同、数据各异,要正确判定实验结论的可信性,还需要深入到相关学科中,进行艰苦的后续研究。这些工作,也只有该学科的专业人员才可能够完成。




https://blog.sciencenet.cn/blog-698426-1021088.html

上一篇:从信息论到认识过程的数学理论--10
下一篇:关于发布回忆录“学习、思考、研究的平凡人生”其他部分的说明
收藏 IP: 1.85.11.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-2 02:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部