生态学时空分享 http://blog.sciencenet.cn/u/lionbin 自我营造一个可持续发展的学术生态系统

博文

大数据时代,我们应该享有“被遗忘的权利” 精选

已有 10621 次阅读 2014-6-3 10:57 |个人分类:一起读顶刊|系统分类:科研笔记| 大数据, 隐私, 遗忘, 删除

30多年前,著名未来学家阿尔文·托夫勒(Alvin Toffler)出版了一本划时代的巨著《第三次浪潮》(The Third Wave)。这本书将人类社会划分为三个阶段:第一次浪潮为农业阶段,约1万年前开始;第二阶段为工业阶段,17世纪末开始;第三阶段为信息化(或者服务业)阶段,从20世纪50年代后期开始,并将大数据称为“第三次浪潮的华彩乐章”。不过,“大数据”真正成为互联网信息技术行业的流行词汇,是从2009年才开始的。也就是从这个概念受到重视开始,有关“大数据挖掘”与“个人隐私保护”矛盾的话题就不绝于耳。

前两年,维克托•迈尔•舍恩伯格(Viktor Mayer-Schönberger)的《大数据时代》卖得很火,其中部分章节也涉及到个人隐私保护的问题。不过,许多人可能没有注意到,维克托几乎同时还出版了一本姊妹篇《删除》:目前90%以上的信息为数字形式,让整个人类丢失了遗忘的天性,世界被设置成记忆模式,互联网记得你的一切,也就是说:记忆成了常态,而遗忘却变成了例外,个人隐私被侵犯的可能性也变大。这种数字记忆带来了两大威胁:信息控制权和永久过去创造的时空幽灵。在这个时代,任何东西一旦放上网络后,就永远有迹可寻不可能彻底被删除。《删除》的中译本中将副标题“The Virtue of Forgetting in the Digital Age”翻译为“大数据的取舍之道”,个人认为欠妥,并没有表达作者原本的含义,不如直译为“在数字时代遗忘的美德”。其实,读完本书就会发现,作者对于信息隐私的问题是持悲观态度的,因此并非谈取舍,而是强调删除和遗忘。从作者最后用三章的笔墨来提醒人们如何恢复遗忘功能中略见一斑,比如:来一场“互联网遗忘”运动,给信息一个存储期限,让遗忘回归常态。

我们可以坐在办公室,拍拍脑瓜,随便想到一个聪明且颇具战略眼光的观点:保护隐私不能因噎废食。但是,这并不能解决任何问题,因为人们潜意识中就一直会担心:如果个人无法真正地获得控制信息隐私的权利,一旦信息被共享,便意味着我们失去了对信息的控制能力。

上周出版的Science周刊中,以“大数据,大问题”(Big Data, Big Questions)为题发表了一篇新闻评论。文章主要是针对科研人员碰到的大数据悖论问题,所以文章开篇提出:研究人员是否可以利用“大数据”而不牺牲个人的隐私?隐藏在大规模数据集下的一些模式,例如通过智能手机应用、在线零售网站或临床试验所收集的数据,能对科学问题产生重要的见解,但共享这些数据很容易让侵犯隐私,导致住房、卫生保健和就业等领域的歧视。由白宫顾问John Podesta所主持的一个报告,要求采取大量的措施,加强对消费者、学生、病人以及其他人的隐私保护。对大数据技术维度的补充报告,主要在由总统科学技术顾问委员会(PCAST)完成,他们得出结论:技术措施本身并不足以保护隐私,建议所采取的政策应该更关注如何使用大数据,而不是如何收集和分析。提出这些问题,并不是一个对自己的技术或方法进行控诉,我们的目标是让大数据的优势得到最充分发挥,同时尽量减少隐私和其他方面的风险。

在过去4年,美国研发支出总体上持续下降了240亿美元。但2012年白宫开始了一项跨越六个联邦部门和机构的2亿美元“大数据发展计划”。去年11月,美国白宫发起“从数据到知识再到行动”(Data to Knowledge to Action),将分别针对医疗研究、地理信息、经济和语言学等多个领域进行研究(http://news.rfidworld.com.cn/2013_11/1766891ff5ce0150.html)。美国总统2015年财政年度预算也将为几个相关的项目提供资金,包括美国国家卫生研究院的“大数据向知识转化”计划(BD2K)和美国能源部的先进科学计算研究项目。BD2K项目将发展多种标准、工具、软件和其他方法来利用由健康和医疗研究领域所生成的大量数据。其中许多问题就是在大数据挖掘与个人隐私保护之间进行博弈。

“我们生活在一个美好的新世界,数据是一种商品,访问数据是一种预期”基因泰克(Genentech)集团医疗主管Ariella Kelman在一个有关科学重现性的论坛会议中如是说。在临床试验中积累巨大数据集的制药公司,其信息访问历来被限制在公司研究人员、合作者和像FDA的监管机构中,但是现在他们在重新考虑数据共享方式。去年,美国药品研究与制造商和欧洲制药行业与协会等两个行业贸易组织,联合会发布了共同准则,旨在推动与患者、研究人员和公众更广泛地共享数据。

一直以来推动利用大数据进行科学研究的医疗卫生行业,也是受争议的最多的。个人DNA信息,是个人隐私还是公众信息或者是科研素材?虽然警方利用DNA信息在寻找杀人凶手的案件中屡建战功,但是,警方采集和利用DNA数据却可能伤害无辜大众的自由和隐私。今年4月14日,为了寻找性侵一名16岁少女的罪犯,法国检察官决定对全校527名男学生和员工进行DNA检验,如果拒绝接受检验者将被视为可能嫌犯。此举引发了侵犯人权的疑虑,美国Times认为这种做法在美国是不被允许的(http://news.163.com/14/0415/09/9PS608UF00014JB6.html)。

谷歌一直为默默无闻记得大家许多事儿而引以为豪,但是最近发生的一件事儿,让谷歌搜索引擎及网络出版商颇为失望:一名西班牙人在谷歌搜索中,发现自己房屋被银行收回拍卖的信息,他认为这样的搜索结果侵犯了他的隐私,要求谷歌删除相关搜索结果。欧洲法庭在5月初对此做出了裁决,判定西班牙人胜诉,这意味着欧盟居民今后在互联网隐私方面,有了相关的法律判例依据。于是,谷歌5月30日放出一个在线表格,让人们提交申请删除个人用户在互联网上的全部搜索信息,短短一天时间收到了欧洲居民12000多个请求,要求还给他们“被遗忘的权利”(从网络上删除与自己相关的电子信息的权利),当然目前该权利仅对欧洲居民开放。(http://tech.163.com/14/0601/15/9TLREIFP00094ODU.html)




https://blog.sciencenet.cn/blog-502444-799964.html

上一篇:珊瑚应对海洋变暖,适应还是顺应?
下一篇:科学家收集生物标本,促进了濒危物种的灭绝?
收藏 IP: 61.129.42.*| 热度|

49 陈楷翰 王德华 王芳 李红 曹聪 罗汉江 鲍海飞 赵美娣 曹建军 彭真明 赵凤光 唐常杰 吕乃基 彭思龙 李健 周健 强涛 周春雷 李伟钢 米春桥 董洁林 肖振亚 王保魁 梁进 胡明艳 吕秀齐 王秀玉 张骥 唐凌峰 张能立 周雄伟 付国珍 许培扬 刘军胜 梁建华 毛宁 杨正瓴 陈铁喜 李强子 应行仁 闵应骅 余皓 刘钢 蔡庆华 zhangling wgq3867 syssci aliala yunmu

该博文允许注册用户评论 请点击登录 评论 (33 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-9 11:11

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部