ZhangQM的个人博客分享 http://blog.sciencenet.cn/u/ZhangQM

博文

链路预测:三阶路径VS二阶路径

已有 6134 次阅读 2010-11-29 22:35 |个人分类:未分类|系统分类:科研笔记| 链路预测

这个想法已经出现了好久,可是一直没有进展,前一段时间涛哥终于说要找我说一说这个事情,最后却只有鸡肋的下场……“写篇博文吧!”涛哥如是说。

话说,有一天我看了2004年的一篇文章《The Link Prediction Problem for Social Networks》,文中提出:小世界效应说明很多长度为2的节点对之间没有发生合作关系,作者发现有许多路径长度大于2的节点对之间发生了合作关系。统计如下表:

 

astro-ph

cond-mat

gr-qc

hep-ph

hep-th

Pairs at distance two

33862

5145

935

37687

7545

New collaborations at distance two

1533

190

68

945

335

New collaborations

5751

1150

400

3294

1576

 

对此,我想到了KatzLocal Path(LP)[1]这两个方法。但由于对Katz进行修改比较复杂,只试验了LP算法。本来,LP算法定义为S=A2+βA3β0.001,而在此基于上表,将其改成了S=βA2+ A3 β0.001(记为invLP),然后在US_airPolitical BlogsPB)、Net ScienceNS)、C.elegans中进行了计算,发现LP1PB网络中提高非常明显,而在NS网络中降低的却非常多(原因在于它的特殊网络结构)。

惊讶之余,涛哥令我统计网络中每条边所在最小环的阶数,如下图所示。(为了能看的清楚,故用红色,刺到您的眼睛还请见谅。横坐标标记为2表示:若某条边所在最小环的阶数大于8或者不存在于任何一个环中,则这条边所在的最小环的阶数被标记为2

当出现如GridINT这两种网络所示的情况时,基于共同邻居的方法就会失效。其实这是由于这两个网络中鲜有三角形存在,所以基于共同邻居的方法才会失效。我感觉这有点脱离了invLP的意义。于是我统计了网络中每条边的两个端点之间二阶路径及三阶路径的数目,发现在上面六个数据中,C.elegansPBUSair三个网络中,三阶路径的数目都远远多于二阶路径的数目,尤其在PB网络中,三阶路径数目是二阶路径数目的数百倍甚至会上千倍,如此一来,三阶路径在LP中起到的作用就很大了。可是,直到目前,不曾想通这个工作能否进行下去……多找一些网络做下试验?

哎,鸡肋啊鸡肋,食之无味,弃之可惜……

姑且先放在这里吧……





https://blog.sciencenet.cn/blog-458509-388728.html

上一篇:有感于菜鸟撰写报告
下一篇:坎坷——要按步就班
收藏 IP: .*| 热度|

3 章成志 周涛 朱郁筱

发表评论 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的精选博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 22:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部