网络中的链路预测是指根据网络的已知边预测可能产生的未知边。预测的方法是基于结点相似性的,即两节点越相似越可能连边。吕琳媛同学总结和提出了21种相似性算法:1)有11种是基于节点的,也就是局部信息的。其中吕琳媛同学提出的Resource Allocation Index和Local Path Index两个指标在其中表现甚好。尤其是后者在有些情况下几乎能够达到和全局算法一样高的精确度,但是相比全局算法具有非常小的计算复杂度。2)有7种是基于全局路径信息的算法。其中吕琳媛同学提出的Local Random Walk和Superposed Random Walk方法具有较高的预测精确度。3)其余3种是比较复杂的算法。该方向已经发表接收期刊论文两篇(PRE+EPJB),会议论文一篇(CIKM 2009),投稿两篇(EPL*2,一篇已经基本接收),一篇综述正在撰写。
⑴T. Zhou, L. Lü, Y.-C. Zhang, Predicting Missing Links via Local Information, Eur. Phys. J. B 71, 623-630 (2009).
⑵L. Lü, C.-H. Jin, T. Zhou, Effective and Efficient Similarity Index for Link Prediction of Complex Networks, Phys. Rev. E (Accepted) arXiv: 0905.3558.
(1) L. Lü, M. Medo, Y.-C. Zhang, D. Challet, Emergence of product differentiation from consumer heterogeneity and asymmetric information, Eur. Phys. J. B 64, 293-300 (2008).
(3) M.-S. Shang, Z.-K. Zhang, T. Zhou, Y.-C. Zhang, Collaborative filtering with diffusion-based similarity on tripartite graphs, arXiv: 0906:5017, Physica A (revised version submitted)
本文设计了以user-based为基础的三部图中的物质扩散算法,并嵌入到标准的协同过滤框架中. 实验结果证明, Tag信息的使用能够极大程度上提高推荐算法的精确度。文章结果较[Physica A 389 (2010) 179]有明显提高。