樊超的学术博客分享 http://blog.sciencenet.cn/u/supermac 让思维随车轮转动

博文

网络拓扑参数究竟意味着什么?

已有 22064 次阅读 2012-6-25 12:18 |个人分类:成果交流|系统分类:论文交流| 复杂网络, 拓扑, 世博, 人流量, 可视图

网络拓扑参数究竟意味着什么?
——从复杂网络看世博人流量
 
    复杂网络的演化模型和拓扑结构一直是网络研究的一个基础,只有充分认识了复杂网络的结构特征才可能进一步研究其它方面的性质。无标度、小世界、等级结构等拓扑特征会对网络的社团结构、级联故障、传播特性等等带来极大影响,那么网络基本的拓扑参数究竟意味着什么?各个节点之间有何关联?我们做了一点尝试性研究。

    以上海世博会每日的客流量为研究对象,首先分析了其总体波动规律,统计量包括Hurst指数、非周期循环长度、均值和标准差。显然,世博人流量具有总体稳定均衡、局部波动明显的特征,每月客流的均值和标准差有显著差别,可以从旅游的客观规律和人们的心理因素来解释。比如,5月刚开展时,客流非常少,人们持观望态度;10月临近结束,很多人手里有赠票、余票,在“不看就浪费”的形势下造成了客流量的爆发,甚至超过了百万,这在世博历史上也不是第一次出现,有经验可以借鉴。

    然后用可视图算法(Visibility Algorithm, Visibility Graph)将人流量的时间序列转化为了复杂网络,该网络具有184个节点,676条边,网络图如下所示。尝试通过网络拓扑结构的分析研究客流量的波动规律。
 
    计算网络的主要拓扑参数,主要结果包括:
平均度7.348;平均聚类系数0.789;网络直径8;平均路径长度3.447;
幂律度分布;小世界;等级结构;网络同配;节点度与最邻近节点平均度成正比。
 
    讨论如下:
1. 网络是无标度的:幂律指数-2.37,说明度分布具有显著的不均匀性,且原时间序列应是分形序列。既然是分形序列,就具有自相似性,那么可以利用自相似对观测值进行有效预测。
2. 网络是小世界的:较大的聚类系数,较短的平均路径长度,且平均路径长度随网络节点数的增长慢于对数增长,即节点之间即使相隔较远也有较短路径可达。进一步推广,说明人类行为的发生的数量在各个阶段间应存在某种特定的紧密联系。
3. 网络具有等级结构:节点聚类系数随节点度幂律衰减,指数-0.97,即节点度越大,其聚类系数就越小。这样的节点即无标度网络中的hub节点,其出现是必然的。这些节点对应着客流量中的极端客流点,这些时间点不仅自身客流量大,且相比周围时间点的客流量也要明显大。也就是说,这样的模式下极端客流量的出现是必然的。
4. 网络是同配的:网络的节点度与时间序列的人流量成正比,Pearson系数r=0.115说明度大的节点倾向于和同样度大的节点连接,节点度和邻居节点度的正比关系也可以说明度大的hub节点会“抱团”,反应在时间序列上就是大客流往往会以一种“成群结队”的形式出现,即大客流会持续一段时间。
 
    最后,我们用修正的线性回归方法对世博人流量进行了预测,效果比较理想。
 
文章信息
FAN Chao,GUO Jin-Li. Visitor flow pattern of Expo 2010. Chin. Phys. B, 2012, 21(7): 070209.


https://blog.sciencenet.cn/blog-419840-585636.html

上一篇:《数据库原理》实验材料
下一篇:我的科学网好友图谱
收藏 IP: 183.187.12.*| 热度|

该博文允许注册用户评论 请点击登录 评论 (24 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-12-1 21:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部