||
节点相似性指标非常重要,在链路预测、节点聚类、个性化推荐、社团挖掘方面应用都很广泛,我就不一一说了。我们认为,一个指标如果要好,必然有相当的稳定性。举个例子,如果给定一个网络G,我把它所有边随机分成两个部分A1和A2,分别用这两个部分计算节点对的相似性。那么一个好的指标,虽然用的信息变少了,针对A1和A2计算出来的相似性排序应该有很大的相关性。反过来,一个烂指标,很可能A1算出来的相似性和A2算出来的相似性差别非常大。
我们针对15种相似性指标,在大量的人造网络和真实网络中作了实验,发现相似性的指标稳定性有很大差异,而常见的共同邻居相似性(CN),AA Index和RAIndex稳定性很好。特别地,我们用这些方法作了个性化推荐的实验,发现用稳定性好的相似性指标,效果很好;反过来用稳定性差的相似性指标,效果不佳,会给出很多不正确的推荐。
论文:
J.-G. Liu, L. Hou, X. Pan, Q. Guo, T. Zhou, Stability ofsimilarity measurements for bipartite networks, Scientific Reports 6 (2016)18653.
全文免费下载链接:
http://www.nature.com/articles/srep18653Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-21 21:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社