flyada的个人博客分享 http://blog.sciencenet.cn/u/flyada

博文

[转载]个性化推荐的十大挑战之九:多维数据的交叉利用

已有 3574 次阅读 2012-4-5 16:09 |个人分类:随手摘录|系统分类:科研笔记|关键词:数据| 数据 |文章来源:转载

挑战九:多维数据的交叉利用

 

目前网络科学研究一个广受关注的概念是具有相互作用的网络的结构和动力学。网络与网络之间的相互作用大体可以分成三类:

第一类是依存关系[47],譬如电力网络和Internet,如果发生了大规模停电事故,当地的自主系统和路由器也会受到影响,导致网络局部中断;

第二类是合作关系[48],譬如人的一次出行,可以看作航空网络、铁路网络和公路网络的一次合作;

第三类是交叠关系[49],主要针对社会网络,这也是我们最关注的。我们几乎每一个人,都参与了不止一个大型的社会网络中,譬如你可能既有新浪微博的帐号,又是人人网的注册用户,还是用手机,那么你已经同时在三个巨大的社会网络中了。与此同时,你可能还经常在淘宝、京东、麦包包、1号店、库巴网……这些地方进行网购,那么你也是一张巨大的用户-商品二部分图中的一员。想象如果能够把这些网络数据整合起来,特别是知道每个节点身份的对应关系(不需要知道你真实身份,只需要知道不同网络中存在的一些节点是同一个人),其中有特别巨大的社会经济价值。举个例子,你可能已经在新浪微博上关注了很多数据挖掘达人的微博,并且分享了很多算法学习的心得和问题,当你第一次上当当网购书的时候,如果主页向你推荐数据挖掘的最新专著并附有折扣,你会心动吗?

 

交叠社会关系中的数据挖掘,或称多维数据挖掘,是真正有望解决系统内部冷启动问题的终极法宝——只要用户在系统外部的其他系统有过活动。单纯从个性化商品推荐来讲,可以利用用户在其他电商的浏览购买历史来提高在目标电商推荐的精确度——当然,每一个电商既是付出者,也是获利者,总体而言,大家能够通过提高用户体验和点击深度实现共赢。与此同时,可以利用微博和其他社会网络的活动提高商品推荐的精度,还可以反过来利用商品浏览历史提高微博关注对象推荐的精度。给一个经常购买专业羽毛球和浏览各种专业羽毛球设备的用户推荐关注羽毛球的专业选手和业余教练成功率应该很高,而且不会陷入“总在一个圈子里面来回推荐”的毛病中。 从机器学习的角度,杨强等人提出的“迁移学习”算法有望移植来解决这种跨邻域的推荐[50]。我们分析了百分点科技服务客户的真实数据,发现有相当比例的用户都具有交叉购物的习惯(在多个独立B2C电商有浏览和购买行为)[51,52]。即便只考虑两个点上,例如利用麦包包的浏览购买数据为名鞋库的用户进行个性化推荐(这些用户在名鞋库上是没有任何历史记录的新用户,但是在麦包包上有浏览购买行为),就可以明显提高推荐的准确度[51](比完全冷启动的随机推荐高数十倍),而如果利用3家或以上的外部电商的数据,其推荐的精确度可以明显高于热销榜(注意,热销榜一点个性化都没有),特别在团购类网站上表现非常好[52]。虽然针对多维数据挖掘的研究刚刚起步,但是我完全相信这在学术和应用上都将是一个焦点和难点。

[47] S. V. Buldyrev, R. Parshani, G. Paul, H. E. Stanley, S. Havlin, Catastrophic cascade of failures in interdependent networks, Nature 464 (2010) 1025-1028.

[48] C.-G. Gu, S.-R. Zou, X.-L. Xu, Y.-Q. Qu, Y.-M. Jiang, D.-R. He, H.-K. Liu, T. Zhou, Onset of cooperation between layered networks, Physical Review E 84 (2011) 026101.

[49] M. Mognani, L. Rossi, The ML-model for multi-layer social networks, 2011 International Conference on Advances in Social Networks Analysis and Mining, IEEE Press, 2011, pp. 5-12.

[50] S. J. Pan, Q. Yang, A survey on transfer learning, IEEE Transactions on Knowledge and Data Engineering 22 (2010) 1345-1359.

[51] 张亮,柏林森,周涛,基于跨电商行为的交叉推荐算法,电子科技大学学报(已接收).

[52] T. Zhou, L. Zhang, L.-S. Bai, L. Gong, C. Li, S. Huang, M.-S. Shang, S. Guo, Crossing Recommendation via Local Diffusion (unpublished). 



http://blog.sciencenet.cn/blog-636598-555675.html

上一篇:[转载]个性化推荐的十大挑战之八:用户界面与用户体验
下一篇:[转载]个性化推荐的十大挑战之十:社会推荐

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-10-22 22:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部