博文

面向效用的社会化网络数据K匿名发布

已有 5934 次阅读 2011-4-16 14:43 |个人分类:我的工作|系统分类:论文交流| 社会化网络, 隐私保护, K匿名, 数据分布

这是是我们组刚刚发表在DASFAA 2011上的一篇论文，“Utility-Oriented K-Anonymization on Social Networks”

随着社会化网络（Social network）网站的兴起和流行，这些网站所获得的用户数据也就包含有极大的科研价值（utility），同时这些数据中又包含有用户的大量隐私信息（private information）。作为数据拥有者的网站方如果把social network数据发布出来是一个很大的问题：一方面用户的隐私信息不可以被泄露，另一方面发布的数据又要对科研人员有价值，如何权衡显得格外重要，这也是数据挖掘中一个重要的课题：隐私保护。

在传统表数据的隐私保护中提出了K匿名（K-Anonymity）的概念，也就是基于某些背景知识F，发布出去的数据中每个数据项都有K-1个其他数据项相同。在social network数据的发布中也同样的引进了K匿名的概念，同时根据不同的背景知识又分为：基于节点度的K匿名，基于顶点邻居结构的K匿名，基于对称的K匿名，基于同构的K匿名等等。图1给出一个这样基于节点度的K匿名例子

图1 基于顶点度的K匿名示例（K=2）

如果一个攻击者知道Alice在网络中有5个朋友，则在图1左侧的图中攻击者很容易就确定那个点代表Alice，而图1右侧的图中因为有两个顶点的度都是5，因此如果攻击者只有顶点度信息的话就无法定位Alice了。

显然，为了保护用户的隐私安全，在数据发布前我们需要对原始数据动些“手脚”，而且希望这些“手脚”对原数据的影响越小越好。之前的工作大部分使用添加/删除边/顶点的数量来衡量影响。可是，我们发现同样一个加边操作，用着图的不同地方产生的影响也是不同的，如图2所示。

图2 不同加边位置对图结构影响不同示例

显然，G2相对G1来说更好的保护了原图G的结构信息。

为了衡量一个边操作对图结构的影响，我们使用Clauset等人提出的Hierarchical Random Graph (HRG)来管理图的community结构，并提出了Hierarchical Community Entropy (HCE)的概念来衡量每一个操作的影响。

DASFAA11_conf_131-1.pdf

转载本文请联系原作者获取授权，同时请注明本文来自谢龙科学网博客。
链接地址：https://blog.sciencenet.cn/blog-483379-433900.html

上一篇：Latex不常用宏包介绍(3)
下一篇：gnuplot生成嵌入字体的eps文件

收藏 IP: 202.161.43.*| 热度|

当前推荐数：2 推荐人：岳金星 黄富强

发表评论评论 (2 个评论)

数据加载中...

返回顶部

博文发布时间已经超过87600小时，评论已关闭。

谢龙

扫一扫，分享此博文

在路上.......分享 http://blog.sciencenet.cn/u/longxie1983 一念嗔心起，百万障门开

博文

面向效用的社会化网络数据K匿名发布

当前推荐数：2 推荐人：岳金星 黄富强

发表评论评论 (2 个评论)

谢龙

全部作者的其他最新博文

全部精选博文导读

相关博文

在路上.......分享 http://blog.sciencenet.cn/u/longxie1983 一念嗔心起，百万障门开

博文

面向效用的社会化网络数据K匿名发布

当前推荐数：2 推荐人： 岳金星 黄富强

发表评论 评论 (2 个评论)

谢龙

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：2 推荐人：岳金星黄富强

发表评论评论 (2 个评论)