||
人的行为在时间和空间上都表现出异常的复杂性,展现了丰富的统计规律,对这些规律的理解对于我们进行异常检测、交通规划、传染病控制、基于位置的信息推荐等等,都非常重要[1]。人类行为所表现出来的复杂性,很大程度上是受到了个体自身兴趣的驱动。尽管以前韩筱璞等人对于兴趣对人类行为的影响有一些理论模型方面的工作[2],直接针对兴趣进行统计规律的挖掘还未见报导。本文是第一次尝试系统分析人类个体在不同兴趣方向上跳转时涌现出来的标度规律。有趣的是,用于分析人类空间移动的方法可以直接借鉴过来,因为每一个兴趣方向都可以看作一个地点。
什么是兴趣跳转了。举个例子,一个用户在淘宝上连续4次都浏览女装,第5次浏览图书,这就是跳转。同样,在移动阅读基地进行手机阅读的时候,可能第一本书是玄幻,第二本是都市言情,这也是兴趣跳转。在科学网上的不同论坛之间晃来晃去,也是典型的兴趣跳转。
我们分析了淘宝、豆瓣和移动手机阅读基地的数据,发现了三个基本的标度律(幂律分布):(1)在同一个兴趣品类上停留的时间;(2)从一个品类离开后到返回该品类的时间间隔;(3)按兴趣高低排序下品类被访问的频次。我们认为是三大因素的合力造成了这些标度律:(1)优先返回;(2)探索未知;(3)惯性。其中前面两个因素在之前的模型[3]中已经被考虑到了,第三个因素是本问题特有的。我们的模型很好再现了实际系统中观察到的标度律。进一步地,我们利用Fano不等式,分析了三个系统下一次访问品类的可预测性[4],分别为:淘宝(84%),移动阅读(83%),豆瓣(93%)。
这个研究的商业价值是很容易理解的。当我们不是在单品层面进行分析,而是就品类跳转进行分析和预测的时候,就可以考虑针对不同用户,在他的“个性化着陆页”里面给出不同的横幅通栏广告(这种广告很贵,而且投放的商家不多,所以我们只需要确定品类,预测这个用户到底是看手机还是看母婴用户,等等)。我们准备在王府井百货网上商城开展这方面的应用。
参考文献:
[1]周涛, 韩筱璞, 闫小勇, 杨紫陌, 赵志丹, & 汪秉宏. (2013). 人类行为时空特性的统计力学. 电子科技大学学报, 42(4), 482.
[2] Han, X. P., Zhou, T., & Wang, B. H.(2008). Modeling human dynamics with adaptive interest. New Journal ofPhysics, 10(7), 073010.
[3]Song, C., Koren,T., Wang, P., & Barabási, A. L. (2010). Modelling the scaling properties ofhuman mobility. Nature Physics, 6(10), 818-823.
[4]Song, C., Qu,Z., Blumm, N., & Barabási, A. L. (2010). Limits of predictability in humanmobility. Science, 327(5968), 1018-1021.
论文发表情况:
Z.-D.Zhao, Z. Yang, Z.-K. Zhang, T. Zhou, Z.-G. Huang, Y.-C. Lai, Emergence ofscaling in human-interest dynamics, Scientific Reports 3 (2013) 3472.
全文链接:
http://www.nature.com/srep/2013/131211/srep03472/full/srep03472.html
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-25 10:56
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社