|||
第五章:世界真小
说到有关科技的问题,萨沙的话就越来越流利:
“比如,你知道吗,遍布地球的万维网的直径是多大﹖”
“当然应该是一个天文数字喽。”
“答案一定让你吃惊。它不是一個天文数字,也不等于地球的直径,而是等于19。”
“奇怪,这个19是哪里冒出来的?不过,我首先需要知道万维网的直径是如何定义的。”嘿,我毕竟是学科学的,可不能那么容易被你唬住。
萨沙说,我不是给你讲过图论吗?首先,让我们给万维网这样的网络的大小下一个定义。任何网络都可以抽象为一个由许多顶点和连线组成的‘图’。比如万维网吧,每一个网页就是一个顶点,网页之间的关系,就用点与点之间的连线表示。
如何理解‘网络图’的大小呢?在几何中,可以用点和点之间的最大距离,也就是‘直径’,来描述几何体的‘大小’。因此,要定义图的大小,首先需要在图论中,也引进‘距离’,或‘直径’的概念。
我说:“对呀,万维网的网页和连接都那么多,直径也应该很大啊……”
但萨沙说,顶点数和连线数并不等同于图的大小。
我有些不服气:“可能不会等同,但总该有点关系吧!”
萨沙想了想,确定地说:没什么关系。举个通俗例子吧,小皮球和吹足了气的大气球都用橡胶做成,小皮球中的橡胶分子数目可以比大气球中的多得多吧,但你说哪个的直径更大些呢?
这个例子有点意思,难道万维网就是个吹起来的大气球?会不会爆炸啊?萨沙不理睬我的随意引申,继续解释‘图的直径’。在纸上画了下面这两个图:
“你看,上面图中网络a的直径等于1,因为任何两点之间都只走一步就能到达。而网络b呢,它和a的顶点数一样,5个,连线数却更少,但它的直径却更大:等于2!因为网络b中两点之间的最大距离是两步……”
一步、两步?啊,原来网络的直径就定义为‘最多有多少步’!不等萨沙解释完,我突然开窍了,抢着说:
“明白了,明白了!万维网的直径等于19是什么意思?那就是说:从万维网的任何一个网页,要到另一个网页,最多是19步。或者说,最多只需要经过19个其它的网页就能到达……,对不对?”
“差不多是这样吧。”
萨沙说,像万维网这种网络,所对应的是具有成千上万个顶点和连线的巨大的‘图’,这种图已经与二百多年欧拉所研究的图有了本质的区别:这些巨大的图不是固定不变的,而是随机的、统计的、算法的。
不过,我们仍然可以用与固定图类似的方式来定义它的大小,只不过,现在的数学量都应该是统计意义上的,所以,任何量的前面,都应隐含着‘平均’二字。比如,对万维网应该说:一个网頁連到任意另一个网頁,‘平均’最多需要按19次鼠标。
“平均、最多?是否说实际上,某一个特殊的连接,有可能要按20几次鼠标?”
萨沙不屑回答我的笨问题,继续说:
“人际关系网的直径更有意思,它的直径小于6……”
对人际关系网来说,每个人就是图中的一个顶点,人与人之间的关系,比如:认识或不认识,就构成图中顶点之间的连线。
人类社会中的各种社团组织,小到家庭、朋友圈、教会、公司、学校,大如党派、政府、国家,都是人际关系网的具体社会体现。随着计算机通信技术的进步,互联网的发展,更有了各种虚拟世界的人际关系网。这个‘六度分隔’,指的是所有人构成的巨大的人际关系网。
要知道,全世界的人口大约有60多亿,如果还将死去的人都包括在内的话,应该是几百个亿的数量级啊。这样一个人类大社会的关系网,它的‘直径’却只等于6!也就是说,地球上任何两个人之间,最多通过6次关联,就能互相到达。这就是所谓“六度分隔”说法的来源。这个‘大社会,小世界’的现象,的确可用一句人们在聚会时偶然碰见意料之外的熟人时常用的话来概括:
“世界真小!”
萨沙又举了一个衡量‘关系网直径’的好例子:比如,我们考虑一个有200个人的教堂,如果这个教堂的每个人都互相认识,意味着任意两人之间都有1条连线互相到达。因此,这个教堂的‘人际关系网直径’是1。
我们再考虑一个只有100人的小公司,分成部门一和部门二,分别有经理A和B。公司员工之间互相认识的不多,两个经理A、B互相认识,且分别认识自己部门的所有员工。这种情形下,在每个部门内部,员工之间互相到达,需要通过自己的部门经理,也就是:经过2条连线。而部门一的员工C,要到达部门二的员工D,则需通过3层关系:C<->A,A<->B,B<->D,三条连线。因此,这个公司的‘人际关系网直径’是3。
从刚才的两个例子不难看出,如此定义的关系网的大小,与关系网的人数是无关的。从人数来看,上例中200人的教堂大于100人的公司;而从关系网来看,公司的直径为3,大于教堂直径1。所以,关系网的直径所度量的,不是人的多少,而是人与人之间关系紧密的程度。
在我们刚才所考虑的教堂和公司的例子中,图的连线并无方向性。也就是说,人们的关系只是一种简单 ‘互相认识’ 的关系。如此而构成的图,称之为‘简单图’。如果我们还进一步考虑‘我认识布什,布什不认识我’之类的情况的话,就得在连线上画上单向或双向的箭头,这样构成的关系网络,称之为‘有向网络’。
萨沙又说,除了‘直径’之外,还有两个有趣的特性表征与人际关系网大小有关的性质:那是‘聚类系数’和‘度分布曲线’。
聚类系数可以用来描述人际关系中的“物以类聚,人以群分”的抱团聚类现象。
聚类系数的数值从0到1变化。用通俗的话来说,如果在一个人际关系网中,每个人所有的朋友互相都是朋友,这个网的聚类系数就是1。反之,如果每个人的朋友互相之间全都不认识,这个网的聚类系数就是0。因此,聚类系数越大,说明抱团抱得越紧;聚类系数越小,说明组织越松散。
对人际关系网聚类系数的研究表明,人际关系网的聚类系数是一个小于1,但大大地大于1/N的数,这儿N是关系网的总人数。人类社会有明显的社团现象。各社团内部联系紧密,社团和社团之间,有相对少得多的连线相连,称之为所谓的“弱纽带”。而正是这些弱纽带,在形成“小世界”模型上,发挥着非常强大的作用。有很多人在找工作时会体会到这种弱纽带的效果。 通过弱纽带的连接,人际关系网的‘直径’迅速变小,人与人之间的距离变得非常“相近”,错综复杂扑朔迷离的人际关系网,因此才表现出了‘六度分隔’的现象。
度分布曲线则可描述人际关系中各种人物的重要程度。人际关系网中的度分布曲线,用通俗的说法,就是网中朋友数目的分布曲线p(k),这儿k是‘朋友数’,p(k)是‘朋友数’为k的人数。比如说,如果有一个100人的社团,每个成员都是完全同等重要的,每个人都有而且只有10个朋友,那么,除了10之外,朋友数为别的数目(1,2,3,4,5,6,7……11,12等等)的概率(人数)都是0。所以,这个人际关系网的朋友数分布曲线就是一个只在在10这个数值处等于100的delta函数。但实际上的人类社会,显然不是一个平均同等的社会。每个人的重要性由他所处的社会位置所决定。比如说,总统、社会名流、或是影视明星的社交圈要比普通人大得多。举例说,大多数的人(上亿个人)平均每人有10-100个朋友,而名人们则可能平均每人有多于120个朋友,性格孤僻的一伙人可能平均每人只有几个朋友,这样的话,度分布曲线看起来是一条在10-100之间出现高峰的一条钟形曲线。
据说一个心理学教授在课堂上提出一个问题:“要认识多少人?才能接触到全世界?”同学们一阵静默后,教授意味深长地说:“你只需要认识一个人!”
这个教授的言外之意是:这个世界事实上是紧密相连着的,也许我们没有察觉出来而已。
萨沙编了一个新三字经,来描述这个‘既大又小’的人际关系网:
大社会,小世界。强作用,弱纽带。物聚类,人分群。六度隔,远朋来。
名流士,多宾客。孤僻人,少往来。勤社交,扩人脉。地球村,温暖在。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 15:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社