气象.水.熵.复杂性分享 http://blog.sciencenet.cn/u/zhangxw 张学文的文章,涉及气象、水分、熵、统计、复杂性、一般科学等

博文

为“信息、复杂程度、熵原理”统一定做的知识体系

已有 6128 次阅读 2007-12-3 13:06 |个人分类:统计、概率、熵、信息、复杂性.1.| 信息, 组成论, 复杂程度

为“信息、复杂程度、熵原理”统一定做的知识体系--组成理论
中国气象局,乌鲁木齐沙漠气象研究所,830002
 
提要: 信息、复杂性和熵都是难理解、难分开的概念。这三者如何准确理解、定义为好,如何准确认识它们的关系?《组成论》是涉及这三者的统一的“知识体系”。“组成理论”分析各种客观事物时使用“广义集合”的概念模型,它指出每个符合这个模型的具体的客观事物(各学科中太多了)必然具有一个“分布函数”(可能是多个)。它指出对分布函数的一种运算(类似求平均值)可以得到一个数值,这个数值恰好描述了该客观事物内部状态的丰富、复杂程度。复杂程度是复杂性研究中的基础概念。信息(熵)是客观事物的复杂程度的映射(影子)。热力学熵是事物的复杂程度的特例。具有随机性的事物必然使它对应的复杂程度自动达到它力所能及的最大值(称为“最复杂原理)。热力学第二定律是“最复杂原理”的特例。“组成理论”用清楚的概念和逻辑链条把“信息、复杂性、熵”融合到一起,也为其他科技领的理论发展提供了机会。
 
关键词:组成论 信息 熵 热力学第二定律 复杂性 系统科学
1.    从信息、熵、复杂性的关系谈起
现代科学中有一些已经被广泛使用而含义不是十分清楚的概念。“信息”、“熵”、“复杂性”就是其中的三个。什么是信息,什么是复杂性?它们分别有数十个定义。什么是熵(音“商”,shang)很多人难理解,可爱因斯坦说熵原理是自然界的最高法则。关于“信息、熵、复杂性”,人们已经分别发表了大量的见解。其中的一些见解还涉及了这三个概念之间的一些关系。人们已经隐约地感到这三个概念不是彼此孤立无关的概念。人们期待科学界为这三个概念提出清楚的定义、明确的关系使它们在大家的思想中是互相补充、互相印证的概念,而不是互不相容、互相拆台,引发混乱的根源。如果可以引出一种比较严密的理论识,它可以把这三个概念的含义和关系统一地表达清楚,那么它就是我们在认识上的重要进步。
《组成论》[1]一书用所谓“广义集合”的模型看待各种具体的客观事物。在这个基础上(含引入的个体概念和标志概念)自然地引出了分布函数概念,并且利用它定义了“复杂程度”概念。《组成论》给出了“复杂程度”概念与信息(熵)的定量关系,也指出热力学熵只是客观事物的复杂程度的一种特例、熵原理只是它提出的“最复杂原理”的特例。可以说“组成理论”是为“信息、复杂程度、熵原理”统一量身定做的知识体系。“组成理论”没有从含糊不清的概念出发泛议它们的关系,它从更基础的、清楚概念出发,慢慢地、逻辑地回答了这些重要问题,并且引出了很多有启发性的新认识。
2.“组成”问题具有普遍性
现代科学的分科已经有数千种之多, 分科越来越细固然是科学发展的重要趋势,但隔行如隔山,它忽视了对客观事物的某些共同概念、模型、规律的探求。《组成论》提出了一种新的视角,它横向地分析各个领域的客观事物普遍存在的“组成”问题。
天体主要由星系组成的、地球表面由海洋和陆地组成的、生物是由微生物、植物、动物组成的、而所有这些又是由分子、原子或者更小的基本粒子组成的。在社会科学和生活中有大量的组成问题,国土由各个省区组成、社会由不同人群组成、政府由各个职能部门组成、人体由各个器官组成、一本书由各个章组成、一场演出由各个节目组成。一套体操、一首歌曲、一付中药都有组成问题。一切事物尽管极不相同,但是都存在内部组成问题。“组成”问题的普遍存在要求我们设法研究它的共同概念、模型、方法、技术和原理。
组成理论用新视角分析各个领域中存在的组成问题,同时也摆正了信息-复杂性-熵的关系。
3.新视角下的基本概念
如何摆脱各个领域关于组成问题的具体内容又要在更高的层次体现它的基本特征?组成论认为首先要提炼描述组成问题的通用概念。能否树立通用于描述组成问题的基本概念(模型)是非常重要的一环。“组成理论”为此提供了三个基本概念:广义集合、分布函数和复杂程度。

 
a a b b b
集合论:这里有两种字符ab
广义集合:这里有5个字符(个体),两个a和3个b
经典的集合概念可以区分一个总体内不同的个体有那些,但是不分析相同的个体有多少。如

 
 
 
 
 
 
对图中的场合,经典集合(set)概念认为框内只有两种不同的元素ab。而组成论引入的“广义集合”概念认为这里有5个个体,两个a和三个b 。在基本概念上的这个很小的区别就引出了新事物。广义集合概念与所谓多重集合概念(multiset)类似,但是强调了“个体”概念。它首先把研究对象看作是一个总体(系统、集体、客观事物):它由N个(整数)大家地位相同、又具有一定的独立地位的个体组成,而且对于某个(可能多个)标志而言,每个个体在给定的时刻都有确定的标志值(如10个学生,每个都有确定的身高)。
在图例中有5个地位相等的个体(字符),其中3个的标志值是b,另外两个的标志值是a
面对每个具体的广义集合,都可以提出一个问题:不同标志值的个体各有多少(如一页汉字文章中不同的汉字各有多少,一个班的同学中不同体重的学生各有多少,一药店中不同名称的药品各有多少)。这类问题的答案统称为分布函数,它描述了不同标志值(字符、体重、药品)在该总体内占有的个体的数量(关系)。
如果一个广义集合内的N个个体具有k种不同的标志值x1,x2,而且它们分别具有的个体的数量为下表
 
标志值(如体重)
x1
x2
 
xi
 
xk
该标志值的个体的数量(学生数量)
n1
n2
 
ni
 
nk
 
那么组成论推荐计算这样一个综合性的物理量C
N是总体(广义集合)的个体总量。根据分析C不仅总为正值,而且具有描述广义集合内各个个体的状态(标志值)的丰富(复杂)程度的能力。“组成理论”把这个物理量称为该广义集合的内部状态的复杂程度。
 “广义集合”在描述很多组成问题时简单又得力。每个明确的广义集合必然伴有一个具体的“分布函数”。对分布函数进行上面的运算就得到一个数值、指标,它恰好描述广义集合(研究对象)的内部状态(组成、构成、成分)的“复杂(丰富)程度”。这样定义的三个概念符合吴学谋教授提出的建立概念要具有“相对普适性”、“相对确切性”和“形式的相对具体性”[2]
广义集合、分布函数和复杂程度是从新视角研究组成问题的三块基石。“组成理论”就踩着这很少的基本概念展开其视野。
集合与多重集合概念在数学领域广为应用(广义集合概念中又补进了“个体”概念),分布函数概念在物理学、概率论中早已应用(组成论仅是利用广义集合定义它,泛化它)。但是现在的广义集合、分布函数、复杂程度概念的应用领域就要广泛的多。“组成理论”里给出了在多个领域的上百类的例子。分析表明复杂程度概念与信息论中的信息熵成正比例,而物理学中的热力学熵就是事物复杂程度的一种。复杂程度概念的明朗化为信息概念进入物理学以及唯物论搭起了桥梁,也为神秘的熵概念的通俗化、准确化提供了思路和语汇。据此我们建议把熵改称为复杂程度
组成问题是系统科学的初级的,重要的内容。姜璐教授说[3]“熵是系统科学的基本概念”,由于熵就是复杂程度,复杂程度也应当是系统科学的基本概念。复杂性研究正在成为一个新的热点,如何研究复杂性?组成论定义的复杂程度应当是复杂性研究的基础部分。组成论与系统科学、信息论、热力学、概率论、复杂性研究都有关系。
4. 通用的规律
如果定义了很多新概念,而没有发现用它们表述的客观规律,那么新概念是否值得提出也会受到质疑。在引入了三个基本概念之后就应当揭示对应的客观规律。“组成理论”指出一些具有普遍适用(普适)意义的规律。目前主要介绍最复杂原理
介绍三个基本概念、最复杂原理和它们的应用是组成论的主轴线。
最复杂原理是物理学中神秘的熵原理在新概念下的泛化。也是信息论中的最大熵方法的物质化。最复杂原理存在于具有随机性的客观事物中。它不是说这个原理非常复杂,而是说客观事物的复杂程度自动地最大化。
火车上有1000位乘客,他们的目的地都相同吗?不会,根据最复杂原理。其目的地自动地最复杂化(去向的复杂程度达到最大值)。进商场的每个人都买了相同的商品吗?不会,他(她)们购买的商品自动最复杂化。允许自行谋生以后,大家的收入都一样多么?不会,最复杂原理指出贫穷者与富翁占的比例自动达到最复杂的程度。一场篮球赛结果是80:70。这150分都是靠三分球得到的或者都是靠罚球得的分吗?最复杂原理指出投篮得分的方式的复杂程度自动地达到最大值。一根麻线缠到一起了,用一把快刀砍上1000次,得到的碎线头都一样长吗?不可能,根据最复杂原理,可以计算出不同长度的线段占的百分比符合负指数分布规律[4]。这个答案恰好定量回答了不同线段所占的比例(组成)问题。
利用最复杂原理可以从理论上得到很多广义集合的分布函数。
为什么会存在最复杂原理?这里给的答案是它来源于客观事物自身具有随机性(各个个体的独立性)。为了严格这个逻辑链条,组成论引入了一个非常浅显的公理。最复杂原理是这个公理的一种推论。
复杂程度概念帮助信息(熵)概念物质化了,也帮助熵概念走出了热力学。复杂程度是各个层次的客观事物本身具有的物理量。化学家通过化学变化时物质的总质量的不变性证实了质量守恒性,物理学通过不同形态的能量变化时其总能量不变性证实了能量守恒性,组成论讨论了物质在变化时其不同形态的复杂程度的互相转化变化问题,指出了客观事物的不同形态的复杂程度也具有互相转化现象。还提出了“信息不可增殖”、客观事物的复杂程度(时间平均值)也具有守恒性的观点。即物质的质量守恒、物质的能量守恒和物质的复杂程度守恒是对称的三个定律(也可以归入爱因斯坦质量、能量公式的扩大化的思路中)。
由于复杂程度联系着客观事物的组成问题,最复杂原理也就是关于各种事物的组成的通用原理(如果它具有随机性)。这不仅为描述组成问题提供了新的概念,也揭示了关于它的一般原理(实为熵原理的泛化)。而这也使熵原理走出了物理学。
组成论主张把熵原理改称为最复杂原理,这样做通俗,又不失准确性,也有利于它迈入诸如社会科学等这些与物理学相距甚远的领域。
史定华教授提出了关于密度演化的理论和方法[5]。密度演化也就是分布函数随时间的变化。例如马尔科夫过程、哈密顿方程等等仅是他列举的个例。很显然,这些知识也可以归入组成论中。实际上流体的连续方程以至量子力学中的波动方程都是关于事物的分布函数(或者是其变态)的有关规律。组成论成为一个知识的集中点以后,可以归入其中的规律是很多的。
5. 广泛的应用
组成论把各个学科中的组成问题归入自己的视野,所以各个领域用各种仪器、方法得到的一切资料都是它研究的对象。即各个学科天然地为此提供了非常丰富的客观事实。从应用角度看,组成论可以做四件事:
Ä 用统一的语言、公式、表格概括各个领域关于组成问题的客观事实(如某些经验公式);
Ä 用最复杂原理等规律与具体约束相结合,定性或者定量解释已经知道的客观事实;
Ä 把一般规律与各个具体领域的特殊条件相结合,预言存在某种现象、规律(公式);
Ä 把发现的规律用于指导实践(社会实践、生产实践、科学实践)。
各个学科中都存在组成问题,但是它们在描述客观事物组成时用的描述工具各不相同。有的给出一个非常简练的公式表示它,有的使用表格,更多的则是定性语言描述、罗列现象或者数字(也有规定了一些很专门的符号描述它)。组成论认为分布函数是描述组成问题的简繁适度的工具,它还为描述离散型的分布函数给出了一种特殊的“多项式”表示方法[6]。利用广义集合分布函数概念,容易把组成问题归结为寻找一个表示分布函数的经验公式。
各个领域都发现了大量的经验公式(唯象关系),其中有一部分就是分布函数。对于这些经验公式经常没有理论说明。于是人们期盼着对应的理论的出现。
最复杂原理的最重要的应用就是配合该领域的特殊条件从理论上推导出定量的分布函数,即从理论上得出客观事物的组成情况。前面的“斩乱麻问题”就是例子。
在各个学科努力引用数学的潮流中,统计数学被推广应用到很多领域。统计数学中介绍十多种经常用到的概率分布公式,并且指出很多客观事物符合这种分布或者另外一种。它们为什么符合这一种或者那一种?对此统计学或者概率论没有统一的说明。
组成论中的最复杂原理可以说明符合那一些约束条件的客观事物必然具有那一种分布函数。最复杂原理为众多的概率分布给出了格式统一(约束条件不同)的理论说明。这不仅使很多经验公式找到了步入理论殿堂的途径,也提高了概率分布函数知识的系统性。
分散在各个学科中的符合分布函数含义的经验公式(概率分布)成千上万,其中80%可能仅停留在经验事实阶段,没有理论解释。最复杂原理就是一个新武器,它很有可能帮助您把它们中的很多经验公式提高到理论高度。理解、掌握和应用最复杂原理既帮助您取得了新的科学研究成果,也提高了科学研究水平、扩大了我们的知识领域。
组成论属于初创,三个概念和一个原理,连同某些概率论、热力学、信息论知识等等都是组成论的最早居民。
6. 与其他学科的关系
组成论是一组定位特殊的知识体系,但是它也与某些科学知识体系有关。
统计与概率:统计学广泛应用于各个领域。统计学研究的对象是什么?哪些对象可以计算平均值?这些一般统计学问题用组成论中的广义集合等语言会表述的更清楚。概率论中有很多概率分布函数。它们为什么是这样?组成论用最复杂原理对一些概率分布提出了统一的物理(原因性的)说明。
物理学:组成论基本思想来自统计物理学,但是又设法使它们泛化(也通俗化)了。统计物理学中和概率论中的分布函数概念的泛化就是广义集合的分布函数概念。热力学第二定律(熵增加原理)和信息论中的最大熵原理(方法)的泛化就是最复杂原理。
信息论:香农的信息论是组成论思想泛化的一种重要基础。复杂程度概念就是落实到物质科学中的信息熵。关于信息量的一些知识是组成论的组成部分。
系统论:系统论主要研究事物内各个元素的特性、组成、功能、结构和关系。组成论是研究系统组成的基础(初级)工具。它为系统论提供了一些基本概念和规律。系统论强调“全量大于分量和”,而无以明确这个“量”究竟是什么,组成论指出有时两个系统(广义集合)的合并可以使新系统的复杂程度大于各个广义集合的复杂程度的“和”。组成论是系统科学的一部分。
复杂性研究:近年来复杂性研究逐渐成为热门。但是把各种领域的复杂问题在没有得力的新概念的情况下都罗列出来会使复杂性研究很快进入死路。对“复杂”进行定量度量是进行复杂性研究的基础一环。组成论中定义的复杂程度正是复杂性研究的基础工作,而这里的最复杂原理是复杂性研究的重要原理。所以把组成论看成是对复杂性的一种(初级、基础)研究是妥当的。组成论不是复杂性研究的全部,但是组成论是复杂性研究不可能回避的部分。
7. 《组成论》的思想来源与初步传播
笔者在探索一些气象问题时发现统计物理学的一些模型对某些气象事例也适用,我们一方面把这归入“熵气象学”[7]中,也相信统计物理学的一些模型同样可以用到其他与统计物理学相距甚远的领域。为了推广这个思路,笔者感到需要泛化和提高统计物理学中的基本概念和对应的逻辑关系。上世纪80年代以来笔者先后提出了“熵就是复杂程度”、“熵原理就是最复杂原理”等论点。1998年开始在网站上把这些认识系统化,为此补入了“广义集合”概念,强化了分布函数概念,定义了复杂程度概念,引出了最复杂原理,2001年把这个系统认识概括为《组成论》,2002年《物理与工程》杂志连载介绍它[8,9,10], 2003年出版了《组成论》。2004年3月 http://www.aideas.com辟专栏评论组成论。后来这些评论扩展到其他网站。
参考文献
[1] 张学文.组成论,合肥:中国科学技术大学出版社,2003
[2] 吴学谋.从泛系观看世界, 北京,中国人民大学出版社,76,1990
[3] 姜璐. 熵-系统科学基本概念,沈阳:沈阳出版社,1997
[4] 张学文,马力.斩乱麻问题,数理统计与应用概率,12卷,4期,315-3211997
[5] 史定华. 密度演化理论简介,自然杂志,22卷6期,323~327,2000
[6] 张学文.字符多项式和表格数学,计算机工程与应用, 38卷,增刊,124-1261282002
[7] 张学文,马力.熵气象学,北京:气象出版社,1992
[8] 张学文.组成论介绍上:广义集合和分布函数,物理与工程,12卷,4期,56-61,64,2002
[9] 张学文.组成论介绍中:复杂程度和复杂度定律,物理与工程,12卷,5期,61-64,2002
[10] 张学文.组成论介绍下:广泛的应用,物理与工程,12卷,6期,57-61,2002


https://blog.sciencenet.cn/blog-2024-12006.html

上一篇:转贴王彬文章:大量粒子系统的课程教学体系探讨
下一篇:“夏热冬用”…采暖节能的新思路
收藏 IP: .*| 热度|

0

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-19 06:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部