提到网络,我们自然就想起互联网。但实际上,互联网只是我们生活中许多网络之一。有个笑话说,外星人用强大的望远镜研究地球,得出的结论是:“在地球大陆上有个巨大的网,上面生活着许多长着轮子,整天跑来跑去的动物。这些动物体内有一种两条腿的寄生虫。”其实,公路网是最容易看见的,其他还有电网,电话网,数据网等等。这些是有形的。还有无形的人际关系网,物流网等等。这些形形色色的网络各不相同,但却有着许多惊人的共性。
抽象地说,一个网络的组成就是一组节点,其中一些节点之间存在着连接。最简单的网络模型,就是每两个节点都有同样的几率建立连接。就这么个简单的模型,就有不少有趣的性质。例如,建立连接的几率有个“阈值”,相当于每个节点平均有两条连接。如果几率超过这个阈值,那么网络的各个节点就会连在一起,否则它们就会形成互不相连的片段。【注一】这个网络结构的“突然”变化,就像水在零度时变成冰的“相变”一样。另一个出乎意料但数学上很容易理解的结论,是任何两个节点之间的平均距离(需要跨过的连接数)都不会很大。节点的平均连接数越大,这个距离就越短。著名的“六度分隔”(世界上每两个人之间通过六个“中间人”就能拉上关系),就是一个例子。
这个随机网络模型虽然简单有趣,却和现实相差甚远。就拿“六度分隔”来说吧,我们都知道人和人的距离并不是一样,而是与社会的结构有关。举个例子吧。美国常春藤学校每年招生数目加起来大概是一万人。美国在阿富汗的驻军大概是十万人。在我们美国华人中,有几个有朋友的孩子今年进了常春藤学校?有几个有朋友在阿富汗打仗?然而,我们也不是生活在完全彼此隔离的世界中。比如我就有个只见过一面的华人朋友,他的儿子是西点培养的未来军官。人际网通常是一个个“圈子”组成的,而圈子之间又有着少数“长途”的联系。其实,这样结构的网络还有很多。如道路网就是以一个个城市组成的“圈子”,之间由高速公路相连。在网络理论中,这样的“圈子”就叫做簇(cluster)。
有了簇的结构,节点之间就不是平等的了。有些节点的连接特别多,因为它们同时参与多个簇。因此,他们也是簇之间的“桥梁”,称之为枢纽(hub)。例如大城市常常是好几条高速公路的交汇点,就是一个枢纽。这种网络有个特点,就是它的稳定性。如果随机地去掉一些节点,网络不会因此而断开,因为大多数节点都属于某一个簇,而簇内的节点之间有很多连接通道。但是如果你有选择性地破坏的话,去掉一些枢纽就会使整个网络解体。互联网就是这样的网络。所以对于随机的设备损坏来说,互联网是很稳定的。但是对于恶意的攻击,它又是很脆弱的。人的交际网也是这样。所以要防止人之间疾病的传播,如果从少数起枢纽作用的“关系大户”着手,就会比平均治疗有效得多。
这种“不平等”网络中有很重要的一类,叫做“幂律”(Power Law)。如果我们把这种网络中的节点按其连接数目来归类的话,就会发现连接越多的节点数目越少,但总有连接非常多的个别节点。事实上,每一类节点的数目与对应的连接数的某个幂(比如负二次方)成正比,所以叫幂律。这种网络又被称为“无标度”(scale-free)。其中的含义这里就不讨论了。在幂律网络【注二】中不仅有枢纽,而且枢纽还有级别。有极少数连接非常多的“超级枢纽”,其他较多的普通枢纽连接数就没那么多。而绝大多数的节点只有很少的连接数。
节点和连接的幂律分布最早是在科学论文相互引用的关系中发现的。后来研究网站的相互链接时也发现了同样的现象,从而引起人们的注意。从那以后,人们发现世界上的很多网络都是幂律的。究其原因,这种特性与网络的生成过程有关。在网络成长的过程中,如果每个节点被新加入的节点所连接的几率它已有的连接数目成正比,那结果就形成了幂律的网络。我们很容易想象论文引用与网站链接在定性层次上都有这样的特性:名气越大的作者和网站越容易吸引新的注意力。这种“富者愈富”的现象在大多数人为的网络上都能见到。即使自然形成的网络也有这样的幂律。例如细胞内各种蛋白质之间相互产生化学反应,也可以看成是一个网络。这个网络也有幂律分布。这当然不是因为蛋白质也会“趋炎附势”,而是进化的结果。在进化过程中,一个蛋白质会分化成几个相似结构的蛋白质。而它们都与原来相连接 的对象保持连接。也可以说,每个节点的连接会成比例地增加,从而形成幂律网络。
幂律网络的研究把动态分析引入了网络理论。但是它只考虑了网络的生成,即节点取得连接的过程。如果节点不仅能得到连接,还能失去连接,情况会怎样呢?非常出人意外的是,这时的网络在数学上与一种量子物理系统完全一样!
考虑一个物理体系,有很多相同的粒子和很多能级。每个粒子都可能存在于某个能级上。按照经典的统计物理,粒子的能量分布是“玻尔兹曼分布”:大多数粒子呆在能量较低的能级,但也有少数会有较高的能量。只有到了绝对零度(物理上不可能实现的理想状况),才会出现所有粒子都呆在最低的能级的情况。但是在量子力学中情况却不同。在某些条件下,在极低(但不是零)的温度下,会出现所有粒子都处在最低能级的情况,称为玻色-爱因斯坦凝聚。1995年,这种已经提出了70年的相变现象终于得到了实验证实。
在网络中,我们可以把节点看成能级,把连接看成粒子。节点对连接有不同的“吸引力”,相当于上述多粒子体系中能级的能量。“吸引力”在节点中的差别程度,就相当于多粒子体系的温度。节点不停地取得和失去连接,相当于连接在不同的节点之间“游走”,网络的结构达到动态平衡。与玻色-爱因斯坦凝聚理论同样的数学推导预言,这样的网络也有“凝聚”的现象,也就是当节点间“吸引力”的差别很大(相当于温度很低)时,一个吸引力最大(相当于能量最低)的节点会吸引所有的连接。这时网络就形成“星状”结构:所有节点都连向一个中心。这就不是“富者愈富”,而是赢者通吃了。当然,现实生活中这种情况很少。即使在高度垄断的微机操作系统市场,微软也还是有些竞争者。然而,这种数学分析对于我们理解一些现象来说是一个很有用的工具。
从上面的讨论可以看出,当我们从最简单的网络模型(随机网络)出发逐步引入其他机制时,每一步都遇到了意想不到的发现。而这还仅仅是开始。例如,我们可以考虑单向的连接,有不同“强度”的连接,或时断时续的连接。这个理论还会变得更丰富,更有趣。
网络理论不仅是一个引人入胜的研究领域,而且有着重大的应用价值。例如,传统经济理论的中心是市场。每个参与者都是与“市场”打交道,试图获取最大利润。但实际上,经济活动并不是这样简单的“一对全体”的关系。公司和个人之间会形成各种合作和竞争的关系,他们的行为会因相互关系的不同而不同。公司的董事会之间有很多交叉任命,形成管理层内部的关系网,对于这些公司影响政策和市场的能力都有重大影响。投资银行之间的交易和资金拆借也构成一个错综复杂的网络。由于这个网络的结构,一个银行遇到困难时就可能影响到整个体系的运作。近年发生的金融危机就是一例。另一个例子是:恐怖组织的内部和相互之间也是网络的连接。我们要顺着网络追踪甚至预测他们的活动,或最有效地干扰他们的运作,也需要了解这个网络的结构和相关性质。这个问题是反恐努力中的一个重要课题。在生物学上,除了前面说到的细胞内蛋白质的网络外,体内的激素调控,以至于生态内的食物链,都是网络。所以,可以说对于网络的认识给许多学科带来了新的范式(Paradigm)。
以上谈到的网络都是自发形成的,连接和节点按照一定的统计规律行动,没有一个“总设计师”。即使完全是人造的网络如电网或互联网,也是在没有集中控制的情况下长时间演化而成的,以至于今天人们还为了编绘这些网络的“地图”而努力。比起完全由人设计的网络,这种自然形成的网络是否有其优越性,就像生物进化的结果那样?我们是否可以在网络演化的某个阶段加以影响,使得最后结果更符合我们的需要?比如,是否能通过立法或政府对某些金融机构的扶持来改变金融界的交易和拆借网络结构,使得金融危机不容易发生?这些也是有趣的课题。
还有一个值得我们深思的网络,就是人类的知识。知识是由很多概念组成的,这些概念之间通过经验或逻辑联系在一起,形成一个网络。目前,我们习惯于把知识分成学科,学科里又有分支,每个分支有基础课,专业课等等,每门课又有第一章,第二章。。。这样,至少从学校出来的人,他们的知识结构基本是线性的,缺少学科之间,分支之间的交叉联系。如果从网络的角度看知识,我们会发现有些概念起着“枢纽”的作用,把不同的学科(类似于网络中的“簇”)联系起来。这样说来,学科之间,以至于科学,哲学,艺术,宗教之间,其实都是相互连接的。让自己的知识结构从“线”变成“网”,对于巩固,扩展和应用这些知识都有好处。另一方面,如果自然形成的网络有其优越性的话,也许我们应该给学生以更多的自由,让他们通过基于自己兴趣和经验的追求而自然形成自己独特的知识网,而不是“生产”知识结构雷同的“线性人”。(见我的另一篇博文:育儿漫谈:“高指标人”和“多情趣人” http://www.sciencenet.cn/m/user_content.aspx?id=304256)
在这个知识网中,“网络”这个概念本身就是一个重要的枢纽了。从以上的讨论中我们可以看到,网络的概念可以用到很多学科中去。这对与研究者个人也是如此。例如对幂律网络的早期研究作出重大贡献的科学家Albert-Laszlo Barabasi,原来是个物理学家。他在上世纪末开始研究网络,在过去十几年中参与了生物,通信,社会学等很多领域的工作。他还在2003年出版了一本畅销书Linked。本文的大多数内容就是基于这本书的。这本书中通过许多名人轶事和作者自己的经历来介绍网络的基本概念,很是引人入胜。在我看来,这本书也是“网络型“知识结构的一个很好例子。
和网络密切相关的另一个概念是“复杂性(complexity)”。复杂性的研究对象是 “复杂系统”,也就是具有很多组成部分,但有一定结构而不是完全随机的系统。关于复杂系统的研究已经有几十年历史了,也有了很多理论如自组织,混沌,临界现象等。幂律和无标度也是复杂性理论中常用的概念。但是目前来看,复杂性研究中很多基本问题还没有得到解决,也可以说是还没有建立行之有效的范式。网络可能是很多复杂系统的一个抽象,可能为复杂性理论提供了一个新的有力工具。
本世纪以来,网络研究发展很快,也取得了很多重要成果。其中的重要原因是现代信息技术和计算技术的发展,使得大规模收集和处理数据成为可能。例如可以从手机通话的记录中分析人和人之间关系的存在和密切程度。我们通过各种卫生组织可以非常细致地追踪疾病的传播。这些瀚如烟海的数据自然引发了网络研究的“淘金热”。但是在我看来,网络研究与复杂性研究一样,面临一个基本的困难,就是没有合适的数学工具。我们大多数科学领域采用的都是“还原法”的研究手段,也就是把一个大系统分解为一个个更为简单的子系统,最终到一些局域化(localized)的单元。我们常用的数学如微分方程等,也是针对这样的局域化的研究对象的。另一个途径是对于整体的统计方法,如统计力学,只考虑一些平均值而完全不管微观的结构。但是对于不可分割而有结构的系统,就没有好的数学手段了。就拿模式识别来说吧。我们人脑可以轻易认出毕加索笔下高度变形的人脸,或莫扎特12个变奏曲中的“一闪一闪小星星”主旋律。但是要设计一个计算机算法来做到这些,就没有好的系统的方法。现在,网上还用识别简单变形的数字和字母作为区别人和计算机的“测验”呢。网络理论的对象也是不可分割的系统而且具有相当丰富的结构。虽然已经应用了图论等数学工具,但看来还是不够。所以网络同时也造成了对新的数学工具以致数学范式的需求。
网络是个既古老又神奇的概念。它是生命的基础,也是生命间共存的方式。今天,通信网络改变了我们的生活方式,物流,金融和人际网络也是我们不可或缺的基础设施。对于网络的研究和认识不仅帮助我们更好地认识很多事务,也会给我们一个观察世界的新角度。在未来十年中,我们一定会有很多令人振奋的发现。
参考读物:
Albert-Laszlo Barabasi, “Linked”, Plume, 2003
Mark Newman, “The Physics of Networks”, Physics Today, November 2008, pp. 33
Marta C. Gonzalez and Albert-Laslo Barabasi, “From Data to Models”, Nature Physics vol. 3, April 2007, pp 224
Multiple papers, Science, vol. 325 Issue 5939 (July 2009)
转载本文请联系原作者获取授权,同时请注明本文来自欧阳峰科学网博客。 链接地址: https://blog.sciencenet.cn/blog-309766-317843.html
上一篇:
奥巴马的赤字 下一篇:
股神巴菲特的人生 ——《滚雪球》读后