|||
预测地点间的人群移动量是交通工程学、经济地理学、社会物理学等领域的一个基本科学问题。一百多年来,研究者们陆续提出了多种人群移动量预测模型,这些模型在经济地理学中称为空间交互模型,在交通科学中称为出行分布模型。其中,引力模型是最经典的出行分布预测模型之一。引力模型的提出最早可以追溯到Henry Carey在1858出版的《Principles of Social Science》一书。经典的引力模型与牛顿万有引力定律的形式非常类似,它假设两个地点之间的出行量与两地点的人口数成正比,与两地点之间距离的幂次(不一定是平方)成反比[1]。这一模型形式简单、概念易懂,不仅被广泛地应用于交通规划中的出行分布预测,还被应用在包括国家或地区之间的移民量预测、贸易量预测、货运量预测、通讯量预测等诸多问题上。但是,引力模型存在的最大问题是包含待定参数,必须根据出行调查数据进行模型的参数估计之后才能实施预测,当缺乏这类数据时则无法使用。类似的问题在介入机会模型、随机效用模型等预测模型[1]中也同样存在。
针对上述问题,2012年Barabási小组提出一个名为辐射模型的出行分布预测模型[2],它的基本假设是出行者在选择目的地时,会选择距出行起点最近且比起点机会数多的一个地点出行(这里的机会数是按正比于地点人口数随机抽样的)。辐射模型的突出特点是不需要任何可调参数、仅输入各地点的人口分布数据就可以相当准确地预测城市间的人群移动量,克服了引力模型存在的缺陷。但是,辐射模型在运用于城市内人群移动量预测时结果却与实际有较大的偏差。下图显示了我们用北京市出租车GPS数据进行的一个对比,图中最左列是辐射模型预测结果,中间一列是实际的出行数据,最右列是我们模型的预测结果。从图中可以看出,辐射模型预测的人群出行范围明显小于实际情况。
我们通过分析认为,造成辐射模型预测偏差的可能原因是:由于城市的聚集范围相对较小,出行者在选择目的地时不是仅仅考虑距离起点最近的高机会目的地,而是会综合衡量城市范围内所有潜在目的地的出行机会数。一般而言,对于具有相同机会数的目的地来说,出行者更倾向于选择近的目的地;而对于距离相近的目的地来说,机会数多的地点对出行者的吸引力更大。换句话说,一个地点被出行者所感受的机会数是该地点的实际机会数按某种方式衰减后剩余的部分。在引力模型中是用一个幂律距离函数来描述这种衰减,但这一函数中不可避免的要引入可调参数。是否存在更自然的、不依赖于具体参数的方式来描述这种机会衰减现象呢?我们在最近的工作中[3]提出了一个新的衰减机制,认为目的地的机会数会按照起终点之间的人口总数加权衰减,即出行者选择一个目的地的概率正比于目的地的机会数,反比于出行者所在地点到目的地之间的人口总数(再减去一个有限尺度效应)。我们将这一模型命名为人口权重机会模型。由于地点机会数可以假设为正比于地点人口数,因此这个模型中所需要的输入数据仅仅是各地点的人口分布,与辐射模型一样是不需要任何可调参数的。
为验证人口权重机会模型的预测效果,我们收集了尽可能多的城市人群移动数据,既包括传统的居民出行调查数据(五个美国城市),也包括新型的人群移动轨迹数据如手机用户数据(一个非洲城市)、社交网络签到数据(六个欧洲城市)和出租车GPS数据(两个中国城市)。下图是在14个案例城市中用人口权重机会模型和辐射模型进行出行预测的准确率对比,从中可以看到我们模型的预测准确率在所有案例中都高于辐射模型。尽管这些城市在人口数量和城市规模、社会文化背景、经济发展水平等方面是非常多样化的,但我们模型却取得了十分稳定的预测效果(准确率都在70%左右),暗示着我们的模型或许抓住了与具体城市背景无关的人群移动模式形成的普遍机制。
人口权重机会模型以其低数据输入需求、高预测精度的特点,为城市规划、交通工程、疾病传播研究等领域提供了一种新的人群移动量预测手段,特别是在缺乏大规模交通调查数据的情况下,这一模型更具有实用价值。该工作近期已被英国皇家学会《交界》期刊(Journal of the Royal Society Interface)接收。可点击http://rsif.royalsocietypublishing.org/content/11/100/20140834.full或http://arxiv.org/abs/1307.7502v2获取全文。
参考文献:
[1] Ortúzar J D, Willumsen L G. Modelling transport. Wiley, 2001.
[2] Simini F, González M C, Maritan A, Barabási A-L. A universal model for mobility and migration patterns. Nature, 2012, 484: 96-100.
[3] Yan X-Y, Zhao C, Fan Y, Di Z, Wang W-X. Universal predictability of mobility patterns in cities. J R Soc Interface, 2014, 11: 0834
附:写给交通规划师的实际操作指南
因为我本人做过一些实际的交通规划项目,我不愿看到我们的模型仅仅停留在纸面上,而是希望有更多的人能够在实际工程中使用它。因此,在这里写一点实际应用这个模型时的注解,希望对交通工程、城市规划等领域的技术人员有所帮助:
人口权重机会模型适合于在没有居民出行调查数据的情况下进行出行分布预测时使用(比如交评或预算有限的规划项目)。所需的基本输入数据有两类:一是城市人口分布,另一个是人均日出行次数。
其中,城市人口分布数据的最佳来源当然是人口普查数据,但这种数据其实在国内也不好获取。目前可行的办法是找替代数据。现在互联网社交签到数据很火,很多研究都用爬取的POI签到密度来近似人口密度,这样再有城市人口总量后,就可以得到近似的城市人口分布了。另外,如果有手机通讯记录数据也可以(当然手机数据在国内也不好拿到),处理方法与签到数据类似。
关于人均日出行次数,一般国内的城市大多在2.5次/人日左右,当然如果有历史调查的或类似城市的数据可以参考更好。如果没有可以做小样本的调查,几百人的抽样规模就足以得到准确的人均日出行次数了。
最后一个小提示,论文中的人口权重机会模型只是带起点出行约束的模型,不能保证终点出行约束。但用Furness方法等迭代技术很容易对模型结果进行双约束,具体方法可随便参考一本交通规划教材,大部分教材都有这方面的技术实现步骤。
这里pwo.zip是人口权重机会模型的C#程序代码以及示例数据。如果您在使用我们模型时有任何问题或改进建议,欢迎随时与我联系。我的email是:kaiseryxy at 163 dot com.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 10:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社