yangleader的个人博客分享 http://blog.sciencenet.cn/u/yangleader 教授,博士生导师,北邮信息安全中心主任

博文

《安全简史(α版)》(1):大数据隐私

已有 15200 次阅读 2016-11-7 15:24 |个人分类:爽玩人生|系统分类:科普集锦

《安全简史(α版)》(1):大数据隐私

杨义先  钮心忻

北京邮电大学信息安全中心

摘要与邀擂:霍金写了《时间简史》,布莱森写了《万物简史》,格雷克写了《信息简史》…。这些简史真的好精彩哟!不但出神入化,而且还能改变读者的世界观!唉~,咱安全界,谁能出面也写部“外行不觉深,内行不觉浅”的《安全简史》来“为百姓明心,为专家见性;为安全写简史,为学科开通论”呀!可惜,论“文”,咱比不过“旅游文学作家”布莱森和“科普畅销书作家”格雷克;论“武”,更不敢比世界顶级科学家霍金。可是,真的又需要有本《安全简史》!怎么办呢?老朽不才,想到了“众筹”和“迭代”,即,为了引出玉,先由我们抛出砖(α-测试版本的初稿),然后,由广大读者来进行全方位的修改、批评和版本更新,包括但不限于写作内容、素材、架构安排、等任何建议。希望“三个臭皮匠”真的能够“赛过诸葛亮”。当然,我们不可能全身心投入《安全简史》,因为,建立旨在统一安全各分支学科的基础理论,《安全通论》,才是我们的主业。但愿有朝一日,咱安全界既有《安全简史》来“立地”,又有《安全通论》来“顶天”。本文是第一块“砖”,主题是隐私发现与保护。谢谢大家!

伙计,恭喜你,到了大数据时代,你就成皇帝了!

陛下,别高兴太早,我说的是那位“穿新衣”的皇帝。真的,在大数据面前,你就是赤裸裸的百十来斤肉:你说过什么话,它知道;你做过什么事,它知道;你有什么爱好,它知道;你生过什么病,它知道;你家住哪里,它知道;你的亲朋好友都有谁,它也知道……。反正,你自己知道的,它几乎都知道,或者说它都能够知道,至少可以说它迟早会知道。

甚至连你自己都不知道的事情,大数据也可能知道,比如,它能够发现你的许多潜意识习惯:集体照相时你喜欢站哪里呀,跨门槛时喜欢先迈左脚还是右脚呀,你喜欢与什么样的人打交道呀,你的性格特点都有什么呀,哪位朋友与你的观点不相同呀等等。

再进一步地说,今后将要发生的事情,大数据它还是有可能知道,比如,根据你“饮食多、运动少”等信息,它就能够推测出,你可能会“三高”。当你与许多人都在独立地购买感冒药时,大数据就知道:流感即将爆发了!其实,大数据已经成功地预测了包括世界杯比赛结果、多次股票的波动、物价趋势、用户行为、交通情况等。

当然,这里的“你”并非仅仅指“你个人”,包括但不限于,你的家庭,你的单位,你的民族,甚至你的国家等。

至于这些你知道的、不知道的或今后才知道的隐私信息,将会瞬间把你塑造成什么,是英雄还是狗熊,那么,谁都不知道,只有天知道!如果你对大数据隐私的这种魔幻能力印象不深的话,别急,请先听听下面这两位世界级大妈的真实故事。

第一位大妈,是一部狗血韩剧的主人翁,名叫朴槿惠。她本来好好地当着总统,正引导大韩民族实现“韩国梦”,民众支持率也高达33%。可是,当她那能够拦截中国导弹的“萨德导弹”还未部署妥当时,自己却被来自网络的导弹击中,身败名裂。第一幕,开场白是这样的:在那遥远的小山村,有一个三本大学,梨花女子大学,走后门破格录取了一位富二代学生:姓郑,名维罗。于是,蝴蝶的翅膀就轻轻一扇:几位抗议者不经意间,通过网络对这位富二代,郑维罗同学,进行了一下小小的“人肉搜索”,于是,哗~,不得了啰!原来,郑同学的老爸竟然曾是朴总统担任议员时的秘书长;秘书长的前妻乃朴大总统的闺蜜;闺蜜的老爸曾被认为是总统的“导师”兼“精神世界的夫妻”……。一时间,大家目瞪口呆了。虽然,后门校长已经辞职,但第二幕还是如期上演了:打了鸡血的网友们,这下可来劲儿了,又是挖,又是刨,既用筛,又用镐,经过一番地毯式的上下求索,哇噻~,又有重大发现!连处级干部都不是的闺蜜,竟然曾提前收到,并无偿修改过至少44份“正国级”总统演讲稿,这无疑于严重破坏国家纲纪!……N幕,韩剧终于达到了高潮:总统向全体国民致歉了,大检察厅宣布设立特别检察组了,总统府秘书长、民政首席秘书、宣传首席秘书等8名核心幕僚辞职了,总统府被紧急改组了,闺蜜被检方以“亲信干政”火速逮捕了,十余万人冒严寒上街游行了,“朴槿惠下台”的怒吼声响彻云霄了……;终于,朴大妈撑不住了,宣布辞职!你看,大数据隐私的威力不小吧,它引起的狂风暴雨,确实不亚于“太平洋对岸那轻轻一扇的蝴蝶翅膀”。

看过韩剧后,咱们再来看美剧。其主人翁就是我们要介绍的第二位大妈,当然,按实际年龄你本该叫她奶奶的;不过,美国人都喜欢被叫得更年轻嘛。这位七十多岁还不想退休的,风风火火的希大妈,为了一份工资并不高的岗位,与另一位脱口秀开始了全面撕逼大战。正当她节节胜利,支持率比对方高出足足12%,胜券在握,即将成为美国历史上首任女总统时,突然,有维基解密的好事者揭露了她的一个隐私,通过截获并分析她的私人邮件,发现她在担任国务卿期间,竟然假私济公:用私人信箱收发公家邮件!慌忙中,希拉里大妈自作聪明,赶紧删除了相关邮件。可惜,她哪里知道大数据的通天本领:已经吹了一把猴毛,把无数个虚拟“孙悟空”撒向了网络空间。只见FBI和黑客们略施小计,写了一行代码,念了一段咒语,然后,轻轻说了声“现~”,于是,那些被删掉的隐私邮件就起死回生了,其中包括8封“绝密”邮件,36封“机密”邮件,2000余封“秘密”邮件,还有约1.5万封与公务有关的非私人邮件。这下子“黎叔很生气,后果很严重”了,因为,按照美国国务院的规定,国务卿的日常工作相关业务,应该在经过授权的服务器上处理。有人叫嚣要起诉希大妈,有人再接再厉穷追猛打,希望发掘更多的隐私炸弹……。反正,她的支持率塌方了。虽然不敢肯定她是否会最终当选为山姆总统,但是,可以肯定的是,希阿姨这次被大数据隐私之蛇狠狠咬过一口后,今后看见井绳都会害怕了。

知道了大数据隐私的上述无穷杀伤力后,你也许就会追问,到底什么是大数据吧。

怎么回答呢!如果我给你背几段专家定义,那么,你很快就被搞晕了。比如,国际权威咨询机构Gartner说:“大数据,就是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产”。麦肯锡全球研究所说:“大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征”。还有更多的权威专家们,总结了大数据的若干其它特性,比如,容量的超大性呀,种类的多样性呀,获取的快速性呀,管理的可变性呀,质量的真实性呀,渠道来源的复杂性呀,价值提取的重复性呀,等等。

伙计,劝你在未被搞晕前,赶紧先从专家定义中跳出来吧!

其实,形象地说,所谓大数据,就是由许多千奇百怪的数据,杂乱无章地堆积在一起的东西。比如,你主动在网上说的话、发的微博微信、存的照片、收发的电子邮件、留下的诸如上网纪录等行动痕迹等,都是大数据的组成部分。在不知道的情况下,你被采集的众多信息,比如,被马路摄像头获取的视频、手机定位系统留下的路线图、在各种情况下被录下的语音、驾车时的GPS信号、电子病历档案、公交刷卡记录等被动信息,也都是大数据的组成部分。还有,各种传感器设备自动采集的有关温度、湿度、速度等万物信息,仍然还是大数据的组成部分。总之,每个人、每种通信和控制类设备,无论它是软件还是硬件,其实都是大数据之源。甚至,像本拉登那样完全与世隔绝,不对外流露任何蛛丝马迹的人,也在为大数据提供信息;因为,一个大活人,“不对外提供信息”本身,就是一条重要的信息,说明此人必定有超级秘密!

一句话,无论你是否喜欢,大数据它就在那里;无论主动还是被动,你都在为大数据做贡献。大数据是人类的必然!

大数据到底是靠什么法宝,才知道那么多秘密的呢?用行话说,它利用了一种名叫“大数据挖掘”的技术,采用了诸如神经网络、遗传算法、决策树方法、粗糙集方法、覆盖正例排斥反例方法、统计分析方法、模糊集方法等高大上的方法。大数据挖掘的过程,可以分为数据收集、数据集成、数据规约、数据清理、数据变换、挖掘分析、模式评估、知识表示等八大步骤。伙计,如果你已能把所有这些方法和步骤搞清楚了的话,那么,恭喜你,你已成为大数据博士了!可惜,一般人根本不关心这些“阳春白雪”,所以,还是让我们请出“下里巴人”来吧。

大数据产业,可能将是世界上最挣钱的产业!无论从工作原理、原料结构,还是从利润率等方面来看,能够与大数据产业相比拟的,也许只有另一个,从来就不被重视的产业,即,垃圾处理和废品回收!

真的,我可不是在开玩笑,更不是在自我贬低哟。

先看工作原理。其实,废品回收和大数据处理几乎如出一辙:废品收购和垃圾收集,可算做是“数据收集”吧;将废品和垃圾送往集中处理工场,算是“数据集成”吧;将废品和垃圾初步分类,算是“数据规约”吧;将废品和垃圾适当清洁和整理,算是“数据清理”吧;将破沙发拆成木、铁、皮等原料,算是“数据变换”吧;认真分析如何将这些原料卖个好价值,算是“数据挖掘”吧;不断总结经验,选择并固定上下游卖家和买家,算是“模式评估”吧;最后,把这些技巧整理成口诀,算是“知识表示”吧!至于教授们的什么神经网络等大数据挖掘方法,在垃圾处理和废品回收专家们眼里,根本就不屑一顾,因为他们有适应性更强、效果更好的方法。若不信,请用你的所谓遗传算法去处理一下垃圾看看,保准一筹莫展。若你非要追问垃圾专家的挖掘方法是什么,嘿嘿,对不起“祖传秘方”,只传后代,并且传男不传女。

再看原料结构。与大数据的异构特性一样,生活垃圾、工作垃圾、建筑垃圾、可回收垃圾和不可回收垃圾等,无论从外形、质地,还是从内涵等方面来看,也都是完全不同的。与大数据一样,垃圾的数量也很多,产生的速度也很快,处理起来也很困难。如果非要在垃圾和大数据之间找出本质差别的话,那么,只能说垃圾是由原子组成的,处理一次后,就没得处理了;而大数据是由电子组成的,可以反复处理,反复利用。

最后来看利润率。确实有人曾在纽约路边的垃圾袋里,一分钱不花就捡到了价值百万美元的,墨西哥著名画家鲁菲诺·塔马约的代表作《三人行》。而从废品中掏出宝贝,更是家常便饭。即使不考虑这些“天上掉下来的馅饼”,就算将收购的易拉罐转手卖掉,也胜过铝矿利润率;将旧家具拆成木材和皮料,其利润率也远远高于木材商和皮货商;总之,只要垃圾专家们愿意认真分捡,那么,他们的利润率可以超过任何相关行业。与垃圾专家一样,大数据专家也能将数据(废品)中挖掘出的旅客出行规律卖给航空公司,将某群体的消费习惯卖给百货商店,将网络舆情卖给相关的需求方等等,总之,大数据专家完全可以“一菜多吃”,反复卖钱,不断“冶金”,而且一次更比一次赚钱,时间越久,价值越大。

大数据挖掘,从正面来说,是创造价值;从负面来说,就是泄露隐私了!大数据隐私是如何被泄露的呢?

从专家角度来看,大数据隐私的发现和保护,其实很简单,它就是:@3#%√≠→Δ&*/)】……。明白了吗?如果明白了,那么就请甭读此文了!

如果还没明白,那么,就请老老实实跟我来分解一下经典的“人肉搜索”吧!

一大群网友,出于某种约定的目的,比如,搞臭某人或美化某人,充分利用自己的一切资源渠道,尽可能多地收集当事人或物的所有信息,包括但不限于网络搜索得到的信息(这是主流)、道听途说的信息、线下知道的信息、各种猜测的信息等等;然后,将这些信息按照自己的目的精练成新信息,反馈到网上与其同志们分享。这就完成了第一次“人肉迭代”。接着,大家又在第一次“人肉迭代”的基础上,互相取经,再接再厉,交叉重复进行信息的收集、加工、整理等工作,于是,便诞生了第二批“人肉迭代”。如此循环往复,经过N次不懈迭代后(新闻名词叫“发酵”),当事人或物的丑恶(或善良)画像就跃然纸上了。如果构成“满意画像”的素材确实已经“坐实”,至少主体是事实,那么,“人肉搜索”就成功了。

前面的朴大妈和希阿姨就是这种“人肉”的牺牲品!可以断定,只要参与“人肉搜索”的网友足够多,时间足够长,大家的毅力足够强,那么,任何人,那怕你是圣贤,是地球的球长,都经不起考验,都能够被最终描述成恶魔或败类。

其实,所谓的大数据挖掘,在某种意义上说,就是由机器自动完成的特殊“人肉搜索”而已。只不过,现在“人肉”的目的,不再限于抹黑或颂扬某人,而是有更加广泛的目的,比如,为商品销售者寻找最佳买家、为某类数据寻找规律、为某些事物之间寻找关联等等,总之,只要目的明确,那么,大数据挖掘就会有用武之地。

如果将“人肉”与大数据挖掘相比,那么,此时网友被电脑所替代;网友们收集的信息,被数据库中的海量异构数据所替代;网友寻找各种人物关联的技巧,被相应的智能算法替代;网友们相互借鉴、彼此启发的做法,被各种同步运算所替代;各次迭代过程仍然照例进行,只不过机器的迭代次数更多,速度更快而已,每次迭代其实就是机器的一次“学习”过程;网友们的最终“满意画像”,被暂时的挖掘结果所替代,因为,对大数据挖掘来说,永远没有尽头,结果会越来越精准,智慧程度会越来越高,用户只需根据自己的标准,随时选择满意的结果就行了。当然,除了相似性外,“人肉”与“大数据挖掘”肯定也有许多重大的区别,比如,机器不会累,它们收集的数据会更多、更快,数据的渠道来源会更广泛,总之,网友的“人肉”,最终将输给机器的“大数据挖掘”。

必须承认,就当前的现实情况来说,“大数据隐私挖掘”的杀伤力,已经远远超过了“大数据隐私保护”所需要的能力;换句话说,在大数据挖掘面前,当前人类还突然有点不知所措。这种情况确实是一种意外,因为,自互联网诞生以后,在过去几十中,人们都不遗余力地将若干碎片信息永远留在网上;其中,每个碎片虽然都完全无害,可谁也不曾意识到,至少没有刻意去关注,当众多无害碎片融合起来,竟然后患无穷!

不过,大家也没必要过于担心,因为,在人类历史上,类似的被动局面已经出现过不止一次了,而且每次最终都会有惊无险地顺利过关;比如,天花病毒突然爆发引发恐慌后,人类便很快将其彻底消灭。其实,只要已经意识到出了问题,人类都一定能够想办法,直到圆满解决。

历史上,“隐私保护”与“隐私挖掘”之间是这样“走马灯”的:人类通过对隐私的“挖掘”,在获得空前好处的同时,又产生了更多需要保护的“隐私”。于是,又不得不再回过头来,认真研究如何保护这些隐私。当隐私积累得越来越多时,“挖掘”它们就会变得越来越有利可图,于是,新一轮的“魔高一尺道高一丈”又开始了。如果以时间长度为标准来判断的话,那么,人类在“自身隐私保护”方面整体处于优势地位,因为,在网络大数据挖掘之前,“隐私泄露”好像并不是一个突出的问题。

针对过去已经遗留在网上的海量碎片信息,如何进行隐私保护呢?如果单靠技术,显然无能为力,甚至会越“保护”就越“泄露隐私”,因此,必须多管齐下。比如,从法律上,禁止以“人肉搜索”为目的的大数据挖掘行为;增加“网民的被遗忘权”等法律条款,即,网民有权要求相关网络删除“与自己直接相关的信息碎片”。从管理角度,也可以采取措施,对一些恶意的大数据行为进行发现、监督和管控。另外,在必要的时候,还需要重塑“隐私”概念,因为,毕竟“隐私”本身就是一个与时间、地点、民族、宗教、文化等有关的东西,在某种意义上也是一种约定俗成的东西,从来就没有过永恒不变的“隐私”,特别是当某种东西已经不可保密时,无论如何它也不该再被看成是“隐私”了;就像非洲某些部落妇女的乳房,至今仍然不是隐私一样。

针对今后的网络行为,在大数时代,应该如何来保护自己的隐私,至少不要把过多的没必要的碎片信息遗留在网上呢?伙计,别急,请打开我的锦囊,其中自有妙计:

澡堂着火了,美女们不顾一切冲出室外;才发现自己却是赤身裸体,慌乱中赶紧捂住下身。惊呆了的看门大爷,急中生智,高叫一声:捂脸,下面大家都一样!于是,一场大面积、情节恶劣的隐私泄露事件,就这样被轻松化解了。回放一下整个事件,关键在哪里呢?对,关键就是两个字:匿名!只要做好匿名工作,那么,对“大家都一样”的东西谈论什么“隐私泄露”,就是无本之木、无源之水了。匿名的重点包括:

身份匿名。任何绯闻或丑事儿,当大家并不知道你就是当事人时,请问你的隐私被泄露了吗?当然没有!没准你还踮着脚,伸着长脖子往前挤,还想多看几眼热闹呢!

属性匿名。如果你觉得自己的某些属性(比如,在哪里工作、有啥爱好、病史纪录等)需要保密,那么,请记住:打死也不要在网上发布自己的这些消息,甚至要有意避开与这些属性相关的东西。这样别人就很难对你顺藤摸瓜了。

关系匿名。如果你不想让别人知道你与张三是朋友,那么,最好在网上离张三远一点,不要去关注与他相关的任何事情,更别与他搭讪。这一点,做得最好的,就是那些特务和地下工作者。

位置匿名。伙计,这一点用不着我来教你了吧。至少别主动在社交媒体上随时暴露自己的行踪,好像生怕别人不知道“你现在正在某饭店喝酒”一样。

概括一下,在大数据之前,隐私保护的哲学是:把“私”藏起来,而我的身份可公开。今后,大数据隐私保护的哲学将变成:把“私”公开(实际上是没法不公开),而我的身份却被藏起来,即,匿名。

当然,要想实现绝对的匿名,也是不可能的。主要的匿名技术包括:

基于数据失真的匿名技术:假如你能够像孙悟空同志那样,一会儿是猫,一会儿成鸟,一会儿变蛇,一会儿为草,那么,除了观音菩萨之外,谁能知道你就是二师兄呢(观音博士为啥能认出悟空呢,因为她(他)能够还原失真)。你本来要上山,却偏要说下河;本来要杀鸡,却偏要说宰鹅;那么,谁会知道你到底要干什么,或者到底已经干了什么呢!

基于数据加密的匿名技术:数据的加密和解密,是安全的重要方面,而且,这种技术的应用几乎遍地开花。我们将专门开辟相关章节来论述密码,所以,此处就不赘述了。不过,请你想想看,如果别人连你发布的信息都读不懂,他怎么会知道那是你的隐私;就算他知道是你的隐私,他又怎么知道隐私的具体内容,毕竟人人都有隐私嘛;如果他不知道你的隐私内容,那么,你就安心睡觉吧。

基于限制发布的匿名技术:不该说的就别说,不该问的就别问,不该动的东西就别动,只要人人都严格按照规矩,老老实实地约束自己在网上的言行,那么,何愁隐私泄露。老兄,如果你不老实的话,嘿嘿~,这项技术就是专门为你量身订制的;如果你胆敢越雷池半步,那么,对不起,你的这条信息它就发不出去,甚至还有可能被追究责任!

当然,在隐私保护方面,绝没有万能的灵丹妙药,任何手段也都有其局限性,否则,科学和技术就不会前进了。保护隐私的最高境界就是:没有隐私(这显然是不可能的)。比如,假若某些人和事是你的隐私,如果你不愿意告诉别人,那就得想办法让别人无法知晓;但这可不是一件容易的事情,因为,俗话说:要想人不知,除非己莫为!

大数据隐私可以变成钱,因为挖掘出来的隐私一般都可以卖出去;但是,大数据隐私又不直接就是钱。只要你能够将隐私与自己的身份完美地隔离开来,那么,掏金者既能够挣到钱,而你也不会有什么损失;但是,如果黑客不只是要挖掘你的隐私,而是要直接偷你的钱,那么,身份匿名等技术就南辕北辙了,因为,坏蛋们只在乎你的钱,而不在乎你到底是谁!

大数据隐私是像孙悟空那样,突然从石缝中蹦出来的吗?当然不是!虽然“大数据”确实是一个新名词,但是,由大数据上演的戏剧,其核心情节却完全是连贯的。甚至,整个人类史,根本就是一部“大数据隐私史”,它可分为相互斗争的两大主旋律:保护隐私和发现隐私,或者说隐私和挖掘。

从字面上看,隐私=+私,即,有“私”之后,才有需要“隐”的对象,才产生了“隐私”;有了“隐”之后,才有去发现被隐之“私”的动力,才诞生了“挖掘”去发现隐私。可见,作为安全的一个方面,与“安全”和“不安全”这对孪生兄弟类似,“隐私保护”和“隐私挖掘”也是孪生的:没有私,就不用隐;有了私,就得隐。这两兄弟几乎同时来到人间,如果非要在他们之间排出个长幼的话,那么,也许“隐私”是兄,“挖掘”是弟;不过,下面时光穿梭机呈现的画面,可能又会将剧情颠倒。虽然不敢肯定谁是兄、谁为弟,但是,有一点是肯定的,即,这对双胞胎永远不即不离、不依不饶,永远都在吵架,甚至拳脚相加;虽然互有输赢,也轮流占上风,但整体上还是旗鼓相当。据算命先生说,这对“同年同月同日生”的兄弟俩,也会“同年同月同日死”;即,共产主义实现后,所有“私”都被彻底消灭之日,便是他们寿终正寝之时。

好了,现在让我们乘坐“爱因斯坦号”时光穿梭机,去考察一下“隐私”双胞胎的出生现场吧。

先看人体自身的隐私是如何诞生的。在那遥远的原始社会之前,虽然无论男女,大家都还光着屁股,但那时却没有隐私。不过,“大数据挖掘”就已登场了。比如,某位院士级“智人”,看了看眼前的一堆脚印,闻了闻地上的那滩鲜粪,摸了摸蹭在树干上的长毛,然后将这三维“大数据”(那时,“3”已算是很大的天文数字了)输入大脑后,掐指一算:不好了,附近有猛虎,快逃!于是,一哄而散,该“院士”就算拯救了一次人类。后来,又不知那位专家发现,若用树叶挡住下身,更有利于激发异性的荷尔蒙,可显著提高生育率,于是,大家都相继模仿,便产生了也许是人类身体上的第一片“隐私”。不管这位专家后来是否获得过诺贝尔医学奖,反正,自从人类开始穿上裤子,再穿上衣服,接着身上的长毛几乎掉光之后,人体上的“隐私”就越来越多了。屁股成了隐私,胸部成了隐私,大腿成了隐私……。甚至,对今天的阿拉伯妇女来说,除了眼睛,浑身上下,仍然全都是隐私;如果没眼睛也能走路,或者单向透视玻璃早几千年就被发明了,那么,也许她们的眼珠子也会变成隐私。与此相反的另一个极端就是,对于比基尼女郎来说,除了“那三点”,就再有没有别的隐私了;在澳大利亚的某些海滩上,对赤身裸体的日光浴者来说,人体隐私又再次全部消失了。

再看看身外隐私是如何诞生的。也许在比“智人”还早的时候,祖先们身上肯定还长满长毛,虽然既无冰箱,更无保险柜,但是,也许悟空它爹突然灵光一现,将捕获的多余猎物,悄悄挖个坑,埋起来,再撒泡尿,标上只有自己懂得的记号,以备应急之需。于是,人类的第一个身外“隐私”就诞生了。也许忘了申请专利,所以,至今像松鼠、猎豹等野生动物,都还在无偿地使用这项隐私保护技术。所以,在很长一段时间内,“藏”都是“隐私”,特别是“物质隐私”,的最有效保护办法。随着人类私有化的推进,“私”越来越多,需要“隐”的对象也越来越多,“隐”的方法也越来越巧妙,“隐私”也就越来越复杂。与之相反,发现隐私的动力也越来越大,挖掘隐私的手段越来越丰富,因为,“隐私”的利用价值越来越大。

后来,家庭产生了,“隐私”的保护和发现也不再限于个体了,因为,家庭也有家庭的隐私了。由于此时的“隐私”基本上都是物质形态,所以,攻方可以通过武力,强行闯入别人家庭,获得某些生活必需品等物质隐私;同样,守方也可通过武力来捍卫自己的物质隐私。

再后来,部落产生了,语言出现了,“隐私”也从物质形态,扩大到了声音形态,即,信息形态。部落成员之间,既可以通过自己的语言相互交流和沟通,同时,也可防止其它部落的人偷听其隐私,比如,在哪里能找到水,哪里有食物,何时行动去抢劫另一部落的食物等。

再后来,国家诞生了,文字发明了,隐私信息不但能够从甲地传到乙地,而且还能够从今天传到明天,甚至从祖辈传给子孙了。“隐”的方法也更丰富了,包括各种密码、咒语、符号等,都变成了某种意义上的隐私保护方法。

总之,为了将各种“私”给“隐”好、用好,几千年来,人类真可谓是绞尽脑汁。比如,把隐私信息一分为多,使每部分都不成其为“私”,而合并起来才是“私”,这其实就是如今“大数挖掘”的逆过程;这种技巧的典型代表就是皇帝调兵遣将的“兵符”。又比如,把“隐私”编制成各种独特的符号,使得没有特殊的额外知识者,就读不懂这些符号;历代巫师的秘笈和宝典,就主要是用这类办法传递的。还比如,军事家的摆兵布阵,八卦陷阱等,就是要让不懂“隐私”者付出生命代价。干脆我们可以说,法律的制定、道德的建设、文化的形成、武器的发明、技术的进步等等,其实从某种意义上看,都是为了保护各种各样的“隐私”。本书中的大部分章节,其实也都是在为保护隐私提供便利,所以,关于“隐私保护”我们就不再赘述了。

人类对“隐私挖掘”的兴趣,一点也不亚于“隐私保护”。其实,人类不但热心于挖掘“自身隐私”,而且,对所有可能的“隐私”都要想挖挖。正是由于在生物进化的激烈竞争过程中,人类在隐私挖掘方面大胜于豺狼虎豹,所以才登上了主宰动物的宝座。在记录人类隐私挖掘成果方面,由于过去使用了完全不同的“专业术语”,以至许多人都没有意识到各专业间的关联,虽然他们甚至身在其中。现在就让我们试试,如果将这些珍珠重新串联成项链,将会出现何种奇妙:

教民们对其教主隐私的挖掘,绝对是如痴如醉。他们以无限崇敬的心情,把挖掘出的教主隐私,编成故事,世世代代传颂几千年。比如,佛教徒们发现,哦~,原来佛主释迦牟尼是白象入胎,从他母亲右腋生下来的,而且,一出生就能说会走。他朝着东南西北四方各走七步,然后一手指天、一手指地,作狮子吼:“天上地下,唯我独尊……”。他每走一步,足下就开出一朵圣洁的莲花,大如车轮;又有两条龙跃上空中,向下喷水,一冷一热,为他沐浴。基督徒们发现,哦~,原来我主耶稣是上帝之子,由他妈妈未婚生之,而且还生在不太干净的马槽里。耶稣诞生时,一颗耀眼的巨星出现在天空,上帝派天军、天使前来宣布:“有一位救主为你们降生了。他就是主基督!你们可以这样认出他,那一位包着布、卧在马槽里的婴孩就是了”。伊斯兰教徒们发现,哦~,原来“万物非主,唯有真主,穆罕默德是安拉的使者”,而除安拉之外别无神灵,安拉是宇宙间至高无上的主宰。安拉是真主,是独一的主,他没有生产,也没有被生产;没有任何事物可以做他的匹敌。安拉是独一无二、永生永存、无所不知、无所不在、创造一切、主宰所有人命运的无上权威。

哲学家们的野心更大,他们既要挖掘世界的全部隐私,又要像小区保安那样,盯住你死问:你是谁?你从哪里来?你要到哪里去?他们要寻找理性的本质以及自存与世界其他存在物的关系,他们要定性、逻辑地认识宇宙整体变化规律,他们还要定性地研究与实在、存在、知识、价值、理性、心灵、语言等有关基本问题等等。老子的哲学成果体现在人与自然之间的关系上,他认为:道是世界本原,人应该顺应自然,无为而无不为。孔子的哲学成果试图解决人与人、人与社会之间的关系,他认为:人应该修身、齐家、治国、平天下,仁者人也。墨子的哲学成果主要在认识论方面,他创建了中国第一个逻辑思想体系,以“耳目之实”的直接感觉经验为认识的唯一来源,提出了检验认识真伪的标准,坚持以人为本,主张以实正名,名副其实。

科学家们则实实在在地潜心于挖掘大自然的隐私。虽然他们也想探索宇宙万物变化规律的知识体系,但是,与哲学家不同的是,他们给出的解释是“可检验的”,他们的知识系统是有序的,并且能够“对客观事物的形式、组织等进行预测”。例如,哥白尼发现了地球在围绕太阳转,伽利略发现了自由落体规律,牛顿发现了万有引力,爱因斯坦发现了物质与能量之间的相互转化规律,爱迪生发明了电灯,瓦特发明了蒸汽机,法拉第发现了电磁感应、抗磁性及电解,麦克斯韦建立了电磁场理论并预言了电磁波的存在,巴斯德建立了细菌理论,道尔顿创立了近代化学,霍金在广义相对论和宇宙论研究方面的成果首屈一指。当然,霍金还出版了几乎家喻户晓的《时间简史》;也正是这本传奇之作,才激发我们来尝试《安全简史》。社会科学家们也用科学的方法去研究人类社会的种种现象,包括但不限于经济学、政治学、法学、伦理学、历史学、社会学、心理学、教育学、管理学、人类学、民俗学、新闻学、传播学等。

文学家们则用语言文字,以小说、散文、戏剧、诗歌等形式,浪漫地表达客观现实;用艺术去挖掘人类情感的隐私。他们让你哭,你就得哭;让你笑,你就得笑;让你怒,你就得怒;让你哀,你就得哀;让你惧,你就得惧;让你爱,你就得爱;让你恶心,你就得恶心;让你欲火烧身,你就得欲火烧身。反正,林黛玉一葬花,你就得跟着流泪;一想起朱自清的《背影》,你就得孝心大增;一看见金山寺住持法海大师,误将白蛇镇法,你就会顿生无尽叹息;一听见李白“日照香炉生紫烟,遥看瀑布挂前川”,你就会马上跟着“飞流直下三千尺,疑是银河落九天”。

至于胡同里的大爷、大妈们,哇噻~,他们更是隐私挖掘的高手、高手、高高手。什么张家媳妇不孝顺呀,李家女儿有男朋友了呀,王家的小狗今天又丢了呀,等等。总之,大家都像寓言中的那位愚公一样,面对隐私这座大山,天天挖山不止;挖呀~挖呀~,自己不行了还有儿子,儿子死了还有孙子,子子孙孙无穷无尽。你也许觉得单位领导就是英明,他经常会做出许多意外但事后证明又是非常正确的决定。这是为什么呢?答案也是大数据中。因为,领导嘛从各个渠道都获得了一些信息(数据),然后,通过对这些数据的挖掘,所得出的决定自然就更加全面了。

好了,不再啰嗦了。你看人类在方方面面的活动,特别是过去称为“研究”的活动,其实许多都是在挖掘隐私,包括星云的隐私、地球的隐私、海洋的隐私、大陆的隐私、动物的隐私、植物的隐私、遗传的隐私、量子的隐私等等。

最后,让我们借用著名诗人余光中的《乡愁》来归纳并结束本章吧。


小时候,还只有电脑,

隐私只是小小的疑虑,

因为,秘密在屋里头,威胁在屋外头;

长大后,出现了网络,

隐私变成萌萌的小虎,

因为,隐私在网这头,黑客在网那头;

现如今,有了大数据,

隐私已是倒悬的利剑,

因为,秘密在云里头,我也在云里头;

看未来,万物互联了,

隐私早已被牢牢控制,

因为,秘密虽在屋外头,我却安然藏屋里头。




https://blog.sciencenet.cn/blog-453322-1013240.html

上一篇:量子的安全笑话
下一篇:《安全简史(α版)》(2):恶意代码与病毒
收藏 IP: 59.64.255.*| 热度|

5 吕乃基 高建召 苏盛 yangb919 chen007

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 17:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部