ICML'11论文:Preserving Personalized Pagerank in Subgraph
已有 5417 次阅读
2011-6-9 21:37
|个人分类:书摘|系统分类:科研笔记|
Facebook, icml, 子图, Sample, PPV
作者在这篇论文中给出了一种新的graph sample方法。真实数据中的graph规模一般都比较大,比如facebook之类的数据,通过sample一些小的子图出了进行分析,也能对这些graph数据的性质有种管中窥豹的效果。
为了保证图的某个特殊性质(degree distributions, clustering coeffcients等),就有不同的子图sample方法。因此sample子图的方法有很多,这些方法也没有什么优劣之分。
可是,这篇论文的作者注意到,之前的方法大多关注的是对图中节点的sample,而不注意边的问题。也就是,之前的方法都是先sample出一个节点子集,然后如果这个子集中的两个点在原图中有边,那么该两点在子图中就有边,否则在子图中就没有边。这样产生的问题是,如果原图中两节点有很多公共邻居,但他们之间却没有直接相连的边,那么在sample出来的子图中他们就是不相连的,这使得子图与原图的性质有很多的差异。
因此,作者提出用Personalized Pagerank Values(PPV)作为要保护的性质,已获得能更好模拟原图性质的子图。
最后我们看看实验结果吧。
https://blog.sciencenet.cn/blog-483379-453426.html
上一篇:
中国审稿人怎么了?竟然把评审的稿件拒了后,换上自己的名字重投下一篇:
发现抄袭论文,编辑应该如何处理?