shugao012的个人博客分享 http://blog.sciencenet.cn/u/shugao012

博文

归纳法与系统论方法的碰撞 精选

已有 7218 次阅读 2018-6-4 10:05 |个人分类:研究生|系统分类:科研笔记

 

 

英国学者罗素在他的《西方哲学史》中说道,从形式逻辑上看归纳法是有问题的,然而现代科学研究却不能没有归纳法。罗素的话,语言往往比较简单,但其中暗藏着深刻的内涵,这可以说是他的写作特点,他甚至还为此获得过诺贝尔文学奖。这句话也是如此,其隐含的问题是:在形式逻辑上归纳法是成立的吗?归纳法的应用有什么限制条件?归纳法在现代科学研究里起什么作用?归纳法之外,别的方法在科学研究中的意义是什么?在罗素的时代,这些问题有过激烈的讨论,当今也不失其意义。20世纪中期,控制论、信息论、系统论的建立提供了探讨这些问题的新视角。如今,系统分析方法已成为地球科学研究的基本方法之一,因此有必要重提这些问题,以便理顺归纳法与系统论方法的关系。

(1)归纳法的形式逻辑问题

归纳法是一种由特殊而推及到一般的方法,例如,当看到几只乌鸦都有黑色羽毛的时候,我们就可能推断,下一次看到的乌鸦也会是如此。这样的推理方式有什么问题呢?有。当连续看到五只白色羽毛鸽子的时候,我们是否认为第六只鸽子也必定是白色羽毛的?恐怕不会,因为凭我们对鸽子的了解情况不是这样。如果把鸽子换做乌鸦,情况就不同了。我们倾向于用先验的知识,来判定乌鸦羽毛的颜色。

事实上,哲学家们很喜欢以乌鸦为例,来讨论归纳法在逻辑上是否成立的问题。早先的哲学家发表过很多有关这个问题的论文。他们争辩说,要使归纳法得以成立,必须要穷尽每一个个体,在乌鸦的问题上,就是要确定每一只乌鸦都是黑色羽毛的,然后才能得出“所有的乌鸦都是黑色羽毛的”这个结论。如果做不到这一点,归纳法就成了简单枚举法,无法保证结论的正确性。就算看到了很多的乌鸦都是黑色羽毛的,也不管用。例如,在一个人生活的地方,即便历史上人们看到的乌鸦全是黑色羽毛的,也不能保证在未来的任何时刻,黑色羽毛都不发生变化。

赞同归纳法的一派想出了一个办法来解释归纳法的可行性,他们提出,如果有很多的个体都表现出一个特征,那么就很可能所有的个体都会有这个特征。于是他们说,他们认为,归纳法可以得出一个或然性很强的结论。这种看法立即受到了另一派的抨击,被指责为是“向概率退却”。逻辑规则的一个特点是,如果前提正确,就必然导致结论的正确;在或然性解释中,正确的前提只能得到或然性的结论,这正好说明归纳法在逻辑上是不能成立的。

争论到此,归纳法的使研究者产生了很强的悖论感。首先,如果我们已经知道所有个体的特征,那么再用归纳法来得出每个个体的特征,这里是否有不必要的重复?是否有点多此一举?其次,按照一些哲学家所说,即便研究者用了概率论、数理统计的方法,所得的结论仍然是或然性的,虽然有一定的可靠性。数理统计方法中有一些固定的流程,但都是针对可靠性量度的,不是针对结论的正确性的,这种说法或多或少让研究者感到不舒服。最后,研究者也有大量的实例,来说明归纳法的应用并不总是需要大量的个例,刀切手指流了血,吃毒蘑菇中了毒,难道还需要再试很多次?只要有一两次,就能归纳出不仅可靠而且正确的结论。这又是怎么回事呢?

虽然罗素本人是数理逻辑的创始人,也是研究悖论问题的高手(他是“罗素悖论”的提出者),但他似乎没有论证过上面所述的这个悖论。其实,这可以用数理逻辑的理论来克服。

(2)数理逻辑框架下的归纳法

数理逻辑的目标,是以公理方式建立一套符号体系,它可以取代传统的形式逻辑体系,而且可以比形式逻辑走得更远,以数学的方式来判定任何一个逻辑推论是否成立。罗素还有一个更大的目标,就是将数学还原为逻辑。为此,他和他的导师在20世纪初出版了《数学原理》一书,记载了他们在这个方向上的努力。最初,人们没有充分意识到这项研究的重要性,然而,当20世纪30年代计算机技术开始出现的时候,人们突然意识到数理逻辑的重要性,随后就有了数理逻辑的深入研究和计算机技术的快速发展。

回到我们的形式逻辑规则上来。数理逻辑当中有一条规则是:

 

P→Q

P

Q

 

这可以解释为形式逻辑中的三段论演绎法,令P的意思与“任何一只乌鸦”项关联,→的意思为“都具有以下特征”,Q的意思与“黑色羽毛”相关联,那么就有了以下的推理:

 

任何一只乌鸦都具有黑色羽毛特征(大前提)

现在有一只乌鸦(小前提)

那么这只乌鸦具有黑色羽毛(结论)

 

根据我们的形式逻辑知识,立即可以判断出这个推理形式是成立的。数理逻辑当中还有一条规则:

 

P

Q

P→Q

 

仍然使用乌鸦的例子,我们有以下推理:

 

有一只被称为“乌鸦”的鸟(大前提)

它具有黑色羽毛特征(小前提)

那么“乌鸦”这个集群中的任何个体都具有黑色羽毛(结论)

 

这个推理方式与前述的归纳法是否非常相像?的确如此,归纳法是从个体观察达到一般结论的,这个推理规则也是,从集群中的一个个体具有黑色羽毛,得出该集群中的每个个体都具有黑色羽毛的结论。但是,这里也有一个不易察觉的区别。在老的归纳法或简单枚举法中,人们对讨论的对象是不设定义域的,例如在前述的案例中,哲学家们无一例外地都回避了定义域的问题,他们案例中的乌鸦,既没有空间分布的定义域,也没有时间演化的定义域,在无限广阔的空间和时间坐标系中,要想得出一个一般性的结论,显然是不可能的。他们在不知不觉中陷入了误区。而在数理逻辑的这个推理方式中,所涉及的个体是有定义域的,即在语言上乌鸦这个名称暗示了一个“集合”,它并不定义在无限在时空范围上。由于这个原因,加入了定义域信息的归纳法就成为一个符合逻辑的推理规则。

我认为,用这个办法来解释归纳法是合理的,也是必要的。说它是合理的,其理由是这个规则在数理逻辑上是成立的。而传统上不设定义域的“归纳法”,却不能表达为符合数理逻辑的规则,应予以抛弃。说它是必要的,其理由是我们从此以后不必为归纳法是否成立而伤透脑筋,在计算机编程、逻辑推理中可以自由使用这种方法。前面提到的那个悖论也可被克服:概率论、数理统计方法是用来分析数据的,目的是获得信息或者函数关系,与逻辑推论无关,没有统计关系,逻辑推论也可以照常进行;在推理中,个体数量的多少也不再是问题,只要对刀、手指、毒蘑菇等给出了确切的定义,“刀切手指流血”、“吃毒蘑菇中毒”就是正确推论的结果,无需试验很多次,更不需要穷尽个例。

有一个容易搞混淆的概念是逻辑规则正确性和结论正确性的关系。人们有时候下意识地认为,如果逻辑正确,结论也应该正确,而以上重新定义的归纳法似乎仍然不能保证结论的正确。这里的失误是,逻辑正确并不能保证结论正确。罗素曾经用过一个“金山”的例子来说明这个道理,他说,“所有的金山都是山,所以有些山是金的”,这句话逻辑没有错,结论有错,原因是其前提不正确。要想结论正确,必须逻辑正确,而且前提也正确。重新定义的归纳法也是如此。历史经验表明,无论用归纳法还是演绎法,科学研究的结论都是以错的,错误的来源是,要么逻辑不对,要么前提不对。在演绎法那里,错误的根源往往是前提不对,这里有一点麻烦,为了说明前提的正确性,必须要寻找到更上一级的前提,以及更更上一级的前提,这就会出现哲学家所说的“无穷倒退”的情况。有什么办法能够止住这种无穷倒退呢?那就是应用归纳法,但老的归纳法有逻辑规则是否成立的问题。用新的归纳法就没有这个问题了;在这里,能否最终把结论搞对,取决于研究对象的定义域能否正确地给出,这显然是科学问题,而不是逻辑问题。科学研究的一大任务,是确定研究对象的定义域,这是新的归纳法所告诉我们的。我们应用归纳法,如果出了错,过去认为是逻辑错误所致,那现在我们肯定地知道它是研究失误所致。在这一点上,与老的归纳法相比,新的归纳法不是很有优越性吗?

(3)归纳法的应用条件:系统科学观点

前面论述了研究对象的定义域对于归纳法应用的重要性。单个因素的定义域,比如某个区域内分布的乌鸦,还是比较容易确定的。但是,当涉及到多个因素,且各自的定义域还会发生时空变化的时候,问题就立刻复杂起来了。对付这个复杂问题的办法之一,是按照系统论的思路来加以考虑。

系统论是在1950年前后提出的。任何研究对象,都可以看成是占据一定时间、空间的系统。系统内部有一定的组织结构,可以划分出子系统,子系统之间、系统与外部环境之间,均存在着物质、能量、信息的传输、转换、循环,对此系统和子系统都会产生响应,响应的方式称为系统行为。显然,系统行为与组织结构和物质能量信息流通相关联,或者说系统行为与一系列因素相关,这些因素决定了组织结构和物质能量信息流通格局。系统论的奠基者们提出,每一个影响因素均可表达为一个和多个变量,而变量和变量之间的关系及其随时间的变化可以表达为数学方程,将多个方程联立起来,就能得到有关系统行为的应变量的解,将系统行为表达为一个时间序列,就能看出系统的演化格局。

这样来说系统论,可能过于抽象。我们不妨把长江流域看成一个系统,来说明系统论的特点。长江流域有180万平方公里面积,由多个子流域(子系统)构成,长江流域的地层,受到物理化学风化作用和河流流水作用的影响,径流和沉积物被输入大海,这就是能量物质的传输转换的例子。长江流域有很多的特征,比如说,长江的水位有时候涨有时候落,水中的悬沙浓度有时候高有时候低,这些特征就是长江流域系统行为的例子。长江流域的沉积物被不断转移到大海,流域内部的地面就会逐渐降低,这就是流域随时间的演化。

如何着手研究长江的系统行为呢?按照系统论的方法,首先要考虑所有的影响因素,例如流域的地面高程、地层特征、植被覆盖情况、日照强度、降水强度、水系形态等。在这些因素中,有些因素影响相对较大,如降水强度,有些因素影响较小,如地表的天体引力效应。不同的因素影响系统的方式也不同,例如降水带来淡水物质和水流动能,而化学风化作用改变矿物的类型。此外,这些影响因素之间也可能有相互作用,例如降水可能改变化学风化强度。对上述问题所进行的研究,称为过程研究。有了过程研究,就可能把不同的事项综合起来,解释具体的系统行为,例如过程研究导致对长江水位、悬沙浓度变化的解释。寻求此类解释的研究称为机理研究。因此,系统论方法的要点,是分析系统的各种过程以及系统行为或现象的发生机理。由于过程机理研究,经常要涉及物质和能量的分析,因此其本质是动力学的。正因为如此,我们常常可以见到流域地貌动力学、河口动力学、流域环境动力学诸如此类的提法。

对于长江流域而言,任一影响因素可以表达为一个或多个变量,降水强度可以表达为逐日降水量、年平均降水量等。在一定的时空范围内,每个变量都有各自的定义域,如果这些定义域是不变的,我们说系统是处于常态。一个常态系统,根据系统论的过程、机理研究方法,系统行为和演化趋势是确定的、可以预测的。每个变量都有固定的定义域,这也是归纳法能够应用的条件。

以长江流域洪水的流量-出现频率关系为例。越大的洪水,出现的概率越低。因此对每一个洪峰流量值,都可以确定一个出现频率的值,在流量-频率坐标系中,将这些点连成一条曲线,就是流量-频率关系曲线,它对于防洪工程是一个重要的设计依据。假如长江流域是常态的,那么该关系曲线的确定既可以使用过程机理分析法,也可以使用归纳法,两者是等价的。

应该指出,纯粹的常态系统是很少的,系统中的变量定义域,往往会随着时间的变化而变化。例如在千年的时间尺度上,长江流域的气候、植被覆盖、裸露地层等因素均会发生变化,在这种情况下,如果按照前面提到的方法来做,所得出的流量-频率关系曲线必然会偏离常态系统下的曲线。在这个条件下做工程,究竟应以哪条曲线为准呢?应以工程运行时间段的时间尺度为准。假如防洪大堤要在2000年到2100年之间运行,则其时间尺度是百年的,根据千年尺度的数据得到的曲线显然是不适用的。在操作层面上,可以将较长的时段,按照系统影响因素定义域的变动速率,分解为较短的时段,其中每个时段的系统都可以近似地看成为常态系统。如此分段运用归纳法,可以建立多个流量-频率关系曲线,供工程设计时选用。在此情形下,归纳法与动力学方法的结果也应该是等价的。

(4)系统状态转换与系统演化

对于长江流域这个系统而言,什么情况下归纳将会失效、这种情况会发生吗?答案是,如果发生系统状态转换,则归纳法的应用就会出现问题,而系统状态转换目前正在长江流域发生。

当一个系统,其中一部分重要因素的定义域突然发生巨变时,我们说这里发生了系统状态转换。这种巨变既有外部的原因,也有内部的原因,有时候内部外部的原因同时起作用。18000年前是低海面时期,7000年前海面上升到现在的高度,这种变化是极地冰盖融化所导致的,是外部原因。两个不同的时期,海面高程有130米的差别,对长江流域的影响,就像东北人突然来到海南岛生活一样。20世纪80年代前后,长江流域的沉积物入海通量发生了变化,此前每年输入海洋的沉积物约为5亿吨,此后逐年下降,到了本世纪入海沉积物每年不到2亿吨,这是人们在流域修建了过多大坝而导致的,也是外部原因。

突变的内部原因,往往与系统演化有关。前面已经提到,常态系统下系统会发生演化,而演化的最终结果,可能达到一个临界状态,使原来的系统难以维持。北美的一种松林就是如此。最初,这种松树在一片森林中扎根,占据一定的空间,之后,所产生的种子不断发芽生长,这次森林中不断挤压其他植物的生长空间。这一物种越生长,其他植物的生长空间就越小,最后森林完全被单一物种所占据。可以说,这种松树是生态竞争中的胜利者,它成功的排除了其他的物种。然而单一物种的森林形成以后,会发生什么呢?原有的树年龄越来越大,而幼树生长却缺乏空间,最终整个森林濒于死亡,森林火灾也许是压在这头骆驼身上的最后一根草。

在更一般的情况下,内部和外部原因同时起作用。长江流域的变化不仅仅是气候变化和人类活动导致的,它自身随着流域侵蚀的进行高程也会下降,进而导致沉积物入海通量的下降。相伴的系统演化,日积月累,最终也可能达到一个临界值或阈值,使系统发生剧烈变化,经常以系统崩溃的形式出现。美国科学家J. Diamond在《崩溃》一书中,总结了系统崩溃的多种机理,其中恶性循环是常见的机理。在科学语言里,恶性循环与系统正反馈过程相联系。例如,长江的刀鱼味道鲜美,于是市场上价格上涨,这又刺激渔民区捕获更多的刀鱼,酷捕导致资源量下降,于是物以稀为贵,市场价格继续上涨。这样的恶性循环,如果不加干预,必然导致刀鱼资源衰竭的后果。

系统状态转换发生之后,系统的各个变量有了新的定义域,系统进入新状态。例如,由于南水北调、气候变化导致降水量下降等原因,长江的径流量与原先状态相比会发生剧烈变化,此时我们应该如何考虑其流量频率关系曲线呢?显然,在归纳法的情况下,针对原先系统所建立的流量-频率关系曲线不再适用,为了建立新的曲线归纳法的研究需要重新开始,资料需要重新收集。而系统分析方法与此不同,若新系统中各个变量的定义域为已知,那么这条曲线很快可以重新定义。这就是两种方法的不同:在跨越系统状态转换的时段,归纳法与系统方法是不等价的。

早年的哲学家们研究乌鸦羽毛问题时也指出了归纳法的这个局限性。他们指出,假如在某个时刻之前,乌鸦全是是黑色,在此之后全变成了白色,那么“乌鸦羽毛全部为黑”的归纳法结论就失效了。但要注意的是,他们对归纳法失效的解释跟这里所说的意思不同。他们想用这个例子来说明归纳法的不合逻辑。但我们这里所说的归纳法失效,是由于这个时刻前后系统状态发生了突变,系统转换之前“乌鸦羽毛全部为黑” 的归纳法结论是成立的,之后这个结论就不成立了,新的结论必须对新的系统重新施行归纳法才能获得。再次重申,归纳法失效的实质,是系统影响因素的定义域发生了巨大的变化。

(5)系统分析方法与多学科交叉研究

按照前面的看法,归纳法只对常态系统有效,系统状态转换之际归纳法失效,因此归纳法虽然可用,但用起来是比较笨拙的。相比之下,系统分析方法却比较灵活,可以同时应对常态系统和系统状态转换两种情形。这似乎是说,总体上系统分析方法可以成为归纳法的替代方法,而且有比归纳法更强的地方。

由于计算机技术的进步,系统分析方法往往可以通过计算机模拟而实现。研究表明,计算机模拟既需要核心理论,也需要不同理论之间的粘合剂(即能够将核心理论贯彻到底的具体算法或数据处理方法)。在地球科学领域,人们经常会非常担心模拟结果的合理性,这种现象是本学科所特有的,别的学科未必如此。例如在材料科学研究里,人们针对各种想象的材料建立本构模型,人们丝毫也不会担心模拟结果的合理性。从逻辑上讲,如果编程没有出错,那么模拟的结果就是模型所依据的基本理论和计算中基本假设下的必然推论,换言之,模型所预测的想象材料的性质是真实的,如果人们需要用到这种性质,按照模型说给出的条件来制造这种材料就可以了。这类模型可称之为“本征态模型”,其意思是说,在模型所规定的前提下,模型输出就是符合逻辑推论的结果;根据前面所说的逻辑的性质,我们知道,如果前提为真,那么结论也必然为真。所以制造新材料的要点,就是要让前提变成真实的,而模型输出结果无所谓真假。

地球科学的问题是,逻辑推论的前提是否为真,有时候不好判断。因此,当人们用任何方法来得出一个结论时,对这个结论都有理由表示怀疑,怀疑的指向实质上并非结论本身,而是结论所依据的前提条件。但是在有些情况下,前提为真这个条件是隐含在定义本身的。例如,当我们说潮滩是在潮汐作用占主导地位、有丰富的细颗粒沉积物供给情况下形成的沉积-地貌体系,我们实际上是在说,若后面两个条件为假,则根本不会有潮滩这回事儿。根据潮滩的定义,后面的两个前提条件,必然是真的。此时,从这两个前提条件出发,来运行沉积-地貌模型,其结果是真是假?显然,这个问题的答案只取决于模型的结构,如果模型结构没有毛病,那么模型输出必然为真,既与真实世界相一致。为了有别于前面所说的本征态模型,这里的模型的名称可修改为“本真态模型”。

当然,建立本真态模型需要做很多工作。科学研究中,理论经常有局限性,算法也有局限性,如何提高模型的可靠性是一个重要的问题。将系统过程机理模型,与大数据分析相结合,可以提高模型的可靠性,这一点我已经在“地球科学中过程-产物关系的大数据分析方法”一文中阐述过了,在此不再赘述。本真态模型一旦建立,就能够很方便地给出一个系统的行为和演化格局。例如,若潮差、沉积物供给率、沉积物泥-砂比例为已知,则形成的潮滩什么样、演化趋势怎么样的问题,就能用模型输出结果来回答;若穷尽这三种变量的所有可能性,就能得到所有的潮滩样式,即潮滩的谱系。任何一个潮滩,其系统行为和演化格局,都可以跟前述的三个因素之间形成一一对应的关系。这个谱系可定义为“潮滩的本真态谱系”。在应用上,这是很方便的,只要知道这三个因素,就立刻可以推出潮滩应有的模样。

本真态的潮滩虽然在自然界确实会有,但系统中的其他因素可能对潮滩产生影响。例如长江口的潮滩,其沉积物分布格局和地貌特征很可能会受到淡水径流、冬季寒潮、台风暴潮、盐沼植被、底栖生物、人类活动因素的影响。如果把这些因素加到模型里,模型的输出结果肯定会不同于本真态条件下的结果。我们不妨把这些输出结果称为潮滩的“衍生态”,把相应的谱系称为“衍生态谱系”。可以想象,由于加入了新的六个因素,衍生态谱系会比本真态谱系复杂得多。相同之点是,如果这些因素为已知,则相应的潮滩特点也立刻可以从谱系中找到。

在模拟方法上,动力学方程是需要考虑的,但有时候简单的方程也能提供很多的信息,沉积物收支方程就是如此。它的一般形式为:

 

dm/dt=P+Qm

 

式中m为沉积物总量,P为物质供给速率,Q为物质损耗参数。这个微分方程的解很容易写出。如果P和Q为已知,则沉积物总量随时间的变化也就可以计算出来。从沉积物的空间分布可以推论地貌特征,而时间序列表示了沉积体系的演化。在网上以“沉积物收支”为关键词,可以找到数以万计的文献,可见这种方法是被研究者所广泛应用的。人们使用这种方法,研究过潮滩、河流三角洲、珊瑚礁等沉积体系的问题。

值得指出,除沉积物之外,针对其他物质收支方程也是成立的,因此可以扩展到其他物质的研究。以格陵兰冰盖为例,通过冰雪的收支状况分析,可以确定冰雪总量的控制因素,进而模拟冰盖的演化。这个事例说明,系统分析方法可以同时适用于多个研究领域的问题,是多学科、跨学科研究的重要手段。

我们说系统分析方法可以替代归纳法,并不是要否定归纳法的应用。在有些情况下,直接使用归纳法显得比较简便,而且在系统分析中,有时也可以将归纳法融合到研究流程之中,提高研究效率。在我们日常的食物中,米饭可以被馒头替代,但有时我们还是愿意吃米饭,这个道理是一样的。

 

(本文是2018年4月与研究生讨论地球科学研究方法时的谈话记录。)

 




http://blog.sciencenet.cn/blog-2336082-1117308.html

上一篇:EGU 2018 会议学术报告发言材料(20180411)
下一篇:《计算机模拟时代的科学》解读与评述

10 姚伟 刘锋 于乐 罗春元 张翠娟 胡涛 黄荣彬 黄永义 王兴民 zjzhaokeqin

该博文允许注册用户评论 请点击登录 评论 (8 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-8-10 05:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部