信息化的本质分享 http://blog.sciencenet.cn/u/Babituo

博文

从广义集合看信息概念

已有 3788 次阅读 2011-1-27 10:22 |个人分类:信息探索|系统分类:论文交流| 广义集合

前言
“广义集合”是我国的气象科技工作者张学文先生提出的一个集合概念,其基本含义是:
广义集合是由不同种类的个体,按每种个体各多少个组成的一个整体。
该集合定义对“熵”概念的通俗化做出了卓有成效的努力,同时,也为从概率分布的角度重新认识热力学第二定律提供了一个基础的工具。
本文通过运用广义集合的定义,深入研究了信息概念的确切外延,得到了“信息是使人们对系统多样性认识减少的东西”的认识,似乎比香农“信息是减少不确定性的东西”更准确实在。


系统分层视图分析模型
对于一个两层的系统,有:
底层视图:系统在底层对全部的每一个组成个体都加以区分的,底层个体的集合;
中层视图:系统在中层对全部的组成个体进行归纳后,得到每种各多个的、多个同类个体集合的集合(广义集合);(需要注意的是:同类个体集合中的个体,只是在中层视图中视为相同、无差别,在底层中,它们之间仍然是不同的,有差别的。)
顶层视图:只有系统一个个体;
在这样对系统进行认识时,得到的不同层次的视图,只是从不同的视角来观察理解系统所得到的表象,实际的系统是系统本身,只有同一个。
 
对于一个个体的集合,可定义如下三个基本概念:
样量:一个集合中的个体的个数(每个个体各不相同)。
多样度:对样量取对数,表示样量大小的规模。含义是:需要一个多少维的规范的编码空间才能标识完每一个元素。可以进一步理解为是:平均每一个集合的元素所占有的多样性的大小。
多样量:样量 X 多样度。含义是:集合中全部元素总的多样性的大小。可直称其“总多样性”。
 
于是,
1.        对于系统的底层视图,有:
系统底层视图的总多样性 = 系统底层样量 X 系统底层多样度;
2.        对于系统的中层视图,有:
中层某个同类个体集合的多样性 = 中层某类个体集合的样量 X 中层某类个体集合的多样度。
系统中层总多样性 = 累加(中层每个同类个体集合的多样性)
3.        对于系统的顶层视图,有:
系统总多样性的减少量 = 系统底层总多样性 - 系统中层总多样性
系统平均多样性的减少量 = 系统总多样性的减少量 / 系统底层的样量

那么,
在如上的分析模型中:
波尔兹曼熵的概念 = 系统单层上的多样性概念
系统信息熵的概念 = 系统在层进中平均多样性的减少量概念
张学文广义集合复杂程度概念 = 系统在层进中总多样性的减少量概念
 
举例说明
用例子说明吧:
比如一个旅行社组织了一个旅游团,共100人,没有重名重姓的。
于是,我们根据姓名这个标志来对旅行团进行“广义集合化”,就得到一个,按姓名分类的广义集合:
100种姓名值的人每种1个组成的集合,就是一个广义集合。
于是,这个视图,就可以当做是我谈到的“底层视图”。
 
同样是这100人的旅游团,现在只取“性别”指标来分类,进行广义集合化,那么,得到的广义集合可能是:
“男性56人,女性44人”组成的一个广义集合。
这个视图,可以当做是我谈到的“中层视图”。
 
显然,在不同的“看法”(标志选取,分类聚集)下,同样是这100个人,我们所得到的“多样性”的大小的认识是不同的,有多大的差别呢?
在底层视图上,广义集合的多样性大小是:100Ln100;
在中层视图上,广义集合的多样性大小是:56Ln56 + 44Ln44;
显然,采用中层视图看到的多样性大小是减少了,减少了多少呢?
减少了:
100ln100 - ( 56Ln56 + 44Ln44)
这么多。
这个,就是张学文先生提出的“广义集合复杂程度”,我理解是“多样性减少总量”;
信息熵是什么呢?
是: S = (100ln100 - ( 56Ln56 + 44Ln44))/100
很显然,是把“多样性减少总量”平均分配到每一个个体上去,也就是:
“平均多样性减少量”了;
这里,非常直观地展示了“信息是不确定性的减少”的意思,准确地说,应该是:对“多样性”大小认识的平均减少量。


理解公式:NLnN-累加(NiLnNi)
在张学文的《组成论》中,公式NLnN-累加(NiLnNi)被理解为是广义集合的复杂程度概念。而我的理解则是“多样性的减少量”。
我们可以把广义集合理解为是一个多个体组成的系统,把广义集合的指标选取分类聚集个体的规则,理解为是对个体进行归纳认识的方法。
当我们对个体能够使用归纳认识方法,找到一些局部的共性的时候,把归纳的局部结果看成是同类个体的做法,其实是掩盖了这个局部的多样性。因为个体本来是各不相同的,只是由于我们选择了可使它们看上去完全相同的观测指标,才使它们看上去没有差别。NiLnNi就是一个分类归纳所掩盖的多样性。
于是,我们可以发现:在使用归纳方法之后,所有同类部分被归纳掩盖的多样性的总和,并不等于不能使用归纳时,系统总的多样性。
存在多样性认识“流失”的情况。该公式表明的,就是由于使用归纳方法所导致的多样性认识的流失。
如何在张学文的“复杂程度”理解和我的“多样性减少量”之间形成沟通呢?
当我们对多个体组成系统选取指标对个体进行归纳的时候,我们认识到:系统的多样性不如以前那么多了。这是因为我们找到的新的信息,也就是个体分类的信息。
此时,我们会认为系统出现了结构,系统结构层次增多了。我们已知的系统结构变得更丰富,变得“更加清晰的复杂”,而不是原来那种“混沌未知的复杂”增加。——原来我们可知的系统结构很少、很简单,现在很多、很复杂了。其实,如果系统本身没有发生变化的话,其客观的复杂性是不变的,只是,其中可被我们认识到的复杂性,随着我们使用的观测指标越来越多,而变得越来越丰富,越来越复杂。
这,也许就是我们会在这样的研究中,会产生发现了“复杂程度”概念感觉的原因。


在认识论层次信息概念小结
简单地说就是:如果你得到了关于一个群体的信息,你就会感觉这个群体的多样性不那么多了。而且还会感觉我们对系统层次结构的了解更加丰富了,我们所获得的对系统复杂程度的已知的认识,就增多了。
从本体论角度理解信息
所谓“从本体论角度”理解,就是试图从客观的层面来理解信息概念所对应的存在事物是什么?
我们能从认识的层次,认识到客观系统的层次形成和演进的、这种可定量描述的规律性的东西,这意味着什么呢?
这不仅意味着我们对客观系统的认识是逐步清晰,逐步理清系统的层次结构的,而且还意味着客观的系统本身,确实也可能存在这样的层次形成演进规律。也就是,我们在这里所认识到的任何一个概念,必然在客观系统本身的身上找到缘由。
客观的系统,必定固有可被我们“清晰地结构化地来表达的复杂性”,这当然是系统固有的属性。而这个属性又必定和客观系统自身所具备的多样性相关。
也就是说,客观多个体组成系统,从无层次结构到有层次结构的演变过程中,必定最初出现个体多样性减少的现象。减少的个体多样性,实际是被更高层次的个体吸收,成为更高层次个体的组成部分了。必定有客观实在的原因来促成这样的现象发生。
比如,那100个旅游团的人,散乱地站成一团,我们分不清男女各有多少;进行男女列队后,我们就能轻易地分辨出了男女各有多少。这里,男女列队,就完成了这个系统层次的演进。 在这个过程中,实际让层次演进发生的原因是必定存在的。
当然,要是所举的例子是非生物出现从无序到有序排列现象的例子,就更能说明“本体层信息”的存在了。是什么原因使得自然的事物出现从无序到有序的排列现象自然出现的呢?必定有客观上的那个原因。而所谓从无序到有序的变化,在最底层上发生的,是多样性的减少。


理解热力学第二定律与进化论的统一
运用本文的系统层次分析模型,我们知道:系统有自发从“更具有中层视图的状态”向“更具有底层视图状态”进行演化的规律。 同时,也有从“更具有底层视图状态”向“更具有中层视图的状态”进行演化的现象。
前者说的是耗散现象,受热力学第二定律主导。后者则是进化现象,受系统层次结构演进规律主导。二者看上去是矛盾的,但实际是互动的。一个恰当的隐喻可以说明这是个“伪矛盾”:对开的汽车一定不相撞,原因是他们在并列平行的两条道路上对开,只是我们从水平方向观测,似乎要相撞而已。实际的效果是:对开的汽车相互为对方腾空了位置。
运用广义集合最复杂原理,张学文把热力学第二定律泛化为了“最可几”原理,通俗地说:就是概率大的事容易发生,概率小的事较难发生。我的另外一种解释可以是:整体更均衡的状态容易维持稳定,整体不均衡的状态较难维持稳定。所以,才有所谓“热寂说”的道理出来。
持这样的观点的人士,只能在一边抱守似乎颠扑不破的“热二”定律的同时,又一边对“进化现象”迷惑不解。再有就是无休止地停留在“适应环境”的局限性上的争议上。实际上,是他们忽视了有在另外一个方向上大量开进的“汽车”的原因,就是:客观信息作用的存在。


后语
复杂系统具有层次结构是一个不争的事实。从广义集合的定义可提示我们,层次结构的形成,在于底层个体的聚合行为。而底层个体聚合的行为所掩盖的多样性总和与聚合前个体多样性总和相比,是减少的。也就是说,在系统发生多样性变化的过程的时候,实际上就是出现系统层次结构变化的时候。
系统层次结构的瓦解,受热力学第二定律支配,而系统层次结构的形成,则受客观的信息守恒定律支配。
在客观的系统中,“样”,只是能量结构的模式。傅里叶变换已经揭示了能量结构模式的本质特征。不同的“样”,只是不同频率成份的能量的混合叠加。
越是具有近似或互补的频率成份的能量的混合叠加的“样”之间,就越容易发生结构性共振。调谐原理是对单一频率特征能量进行提取和传送的一项关键技术,而信息共振则是对多“样”之间的,多频率特征能量的混合叠加结果,进行提取和传送的关键技术。
系统层次结构的形成,是结构化的能量运动的结果。一部分能量结构降解了,必定同时为另一部分能量结构构建提供动力和空间。
因此,从本体论角度来理解:信息,就是结构化的相互作用,这,已经涉及到信息概念的内涵了。关于客观的信息守恒定律,则是有待进一步展开的一场“大戏”。
 
<全文完>
邱嘉文
2010-9-6



https://blog.sciencenet.cn/blog-33982-408265.html

上一篇:多维世界看信息
下一篇:是“信息处理”还是“处理信息”?
收藏 IP: 112.91.148.*| 热度|

1 张学文

发表评论 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 12:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部