|||
科学网资深博主沈阳在小作《微博关系的数学描述: 粉丝模型》[1] 上留言,对笔者团队开发的粉丝模型(Fans model)提出疑问。沈博主是位传媒专业人士,玩了十多年博客的网游子,笔者觉得有必要专门解释一下。其留言是这样的:
[3]沈阳 2012-8-18 04:59
第一次见到用图论函数描述粉丝模型。有一个陷阱是关于行为学六度理论,它的死角会把这个模 型彻底进入不可信。
粉丝模型能够面对陷阱吗?会有死角吗?能不可信吗? 首先我们引用百度百科有关六度分割理论的词条[2,3]:
1967年,哈佛大学的心理学教授米尔格兰姆博士(Dr. S. Milgram,1933~1984) 创立了六度分割理论(Six Degrees of Separation),简单地说:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。后来有人根据这种理论,创立了面向社会性网络的互联网服务,通过“熟人的熟人”来进行网络社交拓展,...
附图 六度分割理论图解 [2,3]
也就是说六度分割理论是在解释“朋友的朋友”的关系和性质,至于在六度以内能不能、如何找到某某人,多少有点悬,需要科学证明。本周在北京举行的《国际知识发现和数据挖掘-KDD 2012》会议上,美国伊利诺伊大学香槟分校(UIUC)韩家炜教授(Dr. Jiawei Han) 做了有关: 异构网络信息挖掘 (Mining Heterogeneous Information Networks) 的专题报告。这位国际数据挖掘界的知名学者也提到社交网络上的一种关系特性和信息转播机制:“朋友的朋友也是朋友(Friends of friends are friends)。”
粉丝模型是对朋友关系的描述。在这里朋友的定义是互为朋友,即互相粉丝关系,简称互粉关系(R-friend) ,用函数fr(.) 表示[1,5]。 进一步的扩展:fr2(.) 就是朋友的朋友集函数;而 frn(.)就是某某的朋友的朋友的... 朋友的集函数。如果用粉丝模型来表达:“朋友的朋友也是朋友”,Fr(.) 也表示互粉关系(R-friend),有:
fr2(.) => Fr(.),此表征刻画出了韩家炜教授等提到的社交网络关系特性。
如果沈主编的孩子第一天到学校,走向社会,结识6个小朋友,相当于对粉丝模型的互粉关系函数一次使用六度分割理论,如果用 |fr(.)| 表示互粉函数集内的元素数,有:
|fr(.)| = 6
假设每个小朋友都有6个朋友,他们都变成沈同学的朋友,则相当于对互粉关系函数二次使用六度分割理论,有:
| fr2(.) | = 36
…
| fr6(.) | = 23436
也就是说,经过六度查询,则相当于对互粉关系函数六次使用六度分割理论,沈同学的心仪人物如果在这23436位朋友里面,就找的到,如果不在,就找不到。值得一提的是,人们常说的朋友空间是66= 46656,可能有误,需要进一步确认。
这些表达方法正说明了粉丝模型可以用来描述六度分割理论提出的朋友关系,可以辅助计算不同“度数”可能涉及的朋友数量。这一点,说明了粉丝模型和其三个特性的普适意义。如果仅从纯数学角度讲,沈阳博主的“陷阱”和“死角”说,已迎刃化解了,因为计算结果,可以告诉在给定朋友范围内和有效“度数”内,能不能找到某某,但不是告诉如何找。
现实生活中,社交网络的用户关系和信息传播,绝不仅仅如此简单。六度分割理论并不适用于大部分交友活动的实际情况,用户间交不交友,传不传信息,随意性很大,如果要指定找到某某还真不好说。实际应用中,可以通过对粉丝模型的函数调整、组合和扩展,来算出新的朋友(粉丝)空间。这正是进一步的知识挖掘的任务,而粉丝模型已为交友类社交网络平台的信息查询和优化奠定了理论基础。
有关韩教授的介绍,请参考科学网另一位资深博主唐常杰教授的博文《在韩家炜老师的实验室和家里作客 — 旅美散记之二》[6]。
相关博文: WISE微博竞赛揭晓 四国名校擂台获奖
参考资料
[1] 李伟钢,微博关系的数学描述: 粉丝模型,科学网博客,2012。 blog.sciencenet.cn/blog-652078-602627.html
[2] SNS, 百度百科,baike.baidu.com/view/8258.htm
[3] 六度空间理论,百度百科, baike.baidu.com/view/200573.htm
[4] Jiawei Han, Mining Heterogeneous Information Networks, KDD Summer School on Mining the Big Data, 2012. kdd2012.sigkdd.org/summer_school.shtml#han
[5] Edans Sandes, Li Weigang and Alba de Mello, 2012, Logical model of relationship for online social networks and performance optimizing of queries, to appear in proceedings of the 13th International Conference on Web Information System Engineering - WISE, Paphos, Cyprus. Championship on T1: Scalability
[6] 唐常杰,在韩家炜老师的实验室和家里作客 — 旅美散记之二,2012。http://blog.sciencenet.cn/home.php?mod=space&uid=287179&do=blog&id=598858
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 11:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社