Lucien7的个人博客分享 http://blog.sciencenet.cn/u/Lucien7

博文

心得体会1507

已有 1534 次阅读 2015-8-4 19:53 |个人分类:心得体会|系统分类:科研笔记

随着移动互联网技术的发展,越来越多的软件提供基于位置服务(LBS),甚至可以说我们手机上的软件,几乎没有不提供LBS服务的。比如,微信上有“附近的人”;你在微博、微信、QQ等社交软件上发布的消息也会提示你是否添加位置信息;已成为昨日黄花的团购网,现在如日中天的外卖网,则完全离不开位置服务。诚然位置服务为我们的生活提供了非常大的便利,但有意无意间泄露的位置信息,极易成为我们保护个人隐私时的隐患。

在《Is privacy still an issue in the era of big data? —Location disclosure in spatial footprints》这篇文章中作者如同侦探一般,向我们展示了如何通过用户泄露的个人地理位置信息进行人肉搜索。首先,作者选取洛杉矶某区作为研究区域,并从推特上筛选了该区最经常发布含位置信息推特的用户;然后将用户发布的位置标注于卫星图上,用户发布推特的位置在地图上一目了然,可以很容易确定用户经常活动的范围;最后根据洛杉矶土地利用类型图,并通过简单分析,确定哪里是用户的家,哪里是他工作的地方,哪里是他常去的地方。

读完此文,感慨良多。

  1. 大数据时代,每个人都是数据的生产者,而这些数据大多是关于我们自己,在我们“生产数据”的时候,必须要权衡是否过多泄露了我们的个人隐私,尽量避免给自己带来麻烦。

  2. 数据分析和数据挖掘在大数据大有可为,在文中作者点到即止,只是判断了作者的工作地点和家庭住址以后就没有再深入发掘,在这里作者只是利用了空间维度的信息,如果再加上时间纬度,我们几乎可以绘制出用户的活动地图,进而分析其活动规律,推测其生活习惯,这在商业上有很高的应用价值,比如百度根据用户搜索习惯推送广告。但这还没有完,如果再加入用户发布的内容信息,这又多了一个维度,而它对了解用户习惯,揣摩用户心思则更有针对性。更上一层,如果将整个地区的用户添加到我们的分析中,对整个地区用户行为习惯的发掘,可以然我们更大胆的去想象,将研究拓展到如商业策划,中心选址等等领域。

  3. 数据可视化技术,应该以更直观的方式去展现数据所展现的内容,长久以来我们的数据可视化研究都只是将数据具象为图表,而具体到图表也无外乎柱状图,折线图,饼状图,以及三者的组合与延伸,虽然也不断有新的图表形式出现,但多半都摆脱不了图表的束缚。针对这种现象,结合文中所示的例子,我们可以发现用户的数据很多都包含了时间信息和位置信息。有了时间,地点和人物,只差情节就能组成一个好故事了,而情节就存在于用户所发的状态中。因此对其进行可视化,完全可以用动画的形式,以此做出某人某时在某地干了什么,对此表现形式我能想到的最直接应用就是案件的侦破。而对区域间的人员流动,贸易交流也完全可以用这种动画的方式展现。现在已经有不少人在进行这方面的实验,也有了不少成果,如某描述全球飞行航线状态的网站。

  4. 时空数据,在很多时候数据会有错误和误差,数据中有两个信息经常包含却很少出错的就是数据的时间信息与空间信息,对时空数据的研究与挖掘应该是很有前景的方向。




https://blog.sciencenet.cn/blog-1858472-910589.html


下一篇:案事件时空数据模型研究
收藏 IP: 218.66.59.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-27 05:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部