王飞跃的个人博客分享 http://blog.sciencenet.cn/u/王飞跃

博文

关于大数据的问答 精选

已有 40585 次阅读 2014-6-13 13:21 |个人分类:随思走笔|系统分类:观点评述


中国社会科学报 唐红丽

1、       当前,“大数据”在业界和学界已成为“时尚”话题,人们认为“人类已进入大数据时代”,并赋予“大数据”之于经济社会发展的作用以“革命性意义”。“大数据”究竟有什么用?一部分人认为“大数据”无所不能”;也有人认为,“大数据”作用的发挥,依赖于数据收集、数据提纯、数据判断等多重关键要素,且数据有时候也会骗人。基于此,有学者指出,大数据“是一个过度包装的概念”,是个伪命题。您认为,大数据到底是“真命题”还是“伪命题”?为什么?

 

王飞跃:

 

追求“时尚”是人类天性的一部分, “大数据”以“时尚”话题的形式风靡全球业界和学界, 不见得是什么坏事,也无须过渡关注非议, 关键是要认清问题的本质。对我而言,问题的本质就是继农业社会和工业社会的发展阶段之后,人类社会正在起步迈向一个崭新的“知业社会”,其核心内容就是信息和智力的大开发,就像农业社会之表征是地表资源土地的大开发、工业社会之表征是地下资源矿藏的大开发一样,所谓“大数据”就是知业社会起步阶段在当下的一个“时尚”符号而已。基于这一认识,“大数据”在本质上是一个“真命题”,而且“大数据”之于经济社会发展也确实具有“革命性意义”,就像工业相对农业对人类经济社会的发展具有革命性的作用一样。

 

但是,“大数据”根本不可能具有“无所不能”的功能!道理十分简单,连“革命”本身都做不到“无所不能”,何况其中的一个阶段性的“大数据”?“大数据”或许能以更加公开、公平、公正的方式转移社会发展的主要矛盾和焦点,就像工业革命并没有完全解决农业社会的问题,但却以更加文明和进步的方式提出社会发展的新问题和新方向。更有可能的是,不要多久,会有新的更加时髦的术语及话题取代“大数据”,这是人性对“时尚”的“刚性”需求,然而问题之本质在很长的阶段不会改变:人类社会的生存与发展之主要矛盾终于脱离了土地,我们正进入以信息和智力资源大开发为表征的“知业社会”。这是人类实现和谐可持续发展的必然之道,数据,不管“大”还是“小”,就是这一崭新的“知业社会”赖以生存和成长的“矿藏”。

 

然而,矿藏需要开发、处理之后才能利用,必须有针对数据的“炼钢厂”、“炼油厂”等,但前提首先要认识其价值。回顾历史,各种自然矿藏在工业社会之前就存在,但几百年前的农业社会里,除了金银铜铁之外,人们对于散落在山坡上的煤块、飘浮在河溪上的石油,几乎是视而无睹,甚至当杂物除之,利用也是“小打小闹”。除了技术上原因,更主要的,是认识上的问题,甚至是“想象”上的问题。客观上,数据早已存在于自然世界和人类社会的各项活动之中,但过去我们没有认清其价值并缺乏收集、处理、利用它们的技术和手段;以至除了数据中的“金银铜铁”之外,对于其它“广大的小数据”们,差不多也是视而无睹,最多不过“小打小闹”的利用一下而已。今天,我们必须清醒地认识到,不管你支持还是反对“大数据”这一“时尚”话题,就像工业革命依靠自然矿藏一样,即将到来的“知业革命”和“知业社会”,必须建立在“数据矿藏”的充分和深度地开发、处理和利用之上。

 

在此,我希望重申一下认识问题的重要意义。许多人或许不认同科学哲学家波谱尔关于整个世界是由物理、心理、人工三个世界组成的观点,但客观上,人类至今的产业发展历程就是农业社会在地表层面上开发了自然的物理世界;工业社会通过文艺复兴在心理世界解放了人类,诱发了科学知识的革命,进而从地下到太空对物理世界进行了深度开发;“知业革命”,就是利用自然矿藏之外的信息与智力“矿藏”,进行第三“人工世界”的大开发,进而回头更加深度地开发第一和第二的物理与心理世界,实现三个世界的和谐生存与可持续发展。我们没有机会及早认识到文艺复兴对于工业革命的意义,结果由世界上曾经的发达国家迅速沦为任人宰割的半殖民地。希望惨痛的历史教训,使我们这一次能够认清基于“数据矿藏”的信息与智力资源对于“知业革命”的意义,从物联网、大数据、云计算到知识自动化、社会计算、智慧社会,扎扎实实地进行数据收集、数据提纯、数据解析、数据利用等等,使我们真正成为智力上的世界强国,借机实现中华民族复兴的“中国梦”。总之一句话:我们必须以重视和利用矿藏的方式,重视和利用数据!

 

的确,眼下“大数据”已经被过度包装。“大数据”时尚,但非万能,不必事事时时相连。正如时装的本质是为了推动健康文明,但不可时时人人时装,特别如果人人都成了时装演员,就更荒唐了。凡事有度,我认为“过度包装”只是短暂的“超调”现象而已,只要“大数据”不被炒成“大跃进”,不必过虑。

 

2、       您认为,“大数据”的负面作用有哪些?如何规避风险?

 

王飞跃:

 

相对于视大数据本身为“伪命题”,我更倾向于认为“大数据的负面作用”是一个“伪命题”,因为大家都知道科技本来就是一支双刃剑,关键是谁用和如何用。但此时讨论“大数据的负面作用”确实有意义,特别是在国外刚就谷歌等在大数据应用中的一些失败展开了“大数据:大错误?”反思之后。我个人最关注的是在微信、微博等社会大数据之下如何保护个人隐私的问题,还有如何防止大数据的大规模应用失误可能造成 “大错误”的问题。个人隐私保护急需相关的立法,在保障合法权利之下,防止有人利用大数据技术进行人身攻击。例如,美国许多州已经或正在立法,禁止“Revenge Porn(报复性不雅照片)”行为,即失恋或关系结束后将原朋友的私密照投放社会媒体等现象,曾经常发在青少年之中。至于如何有效避免大数据大错误的发生,不妨借鉴上世纪九十年代由于无节制的计算机交易多次促成并加剧股市崩盘之后,有关国家对快速大量自动交易所采取的一些措施。

 

不过,我更担心的是不及时有效地开发、处理、利用“大数据”可能造成的负面作用甚至国家风险。从农业到工业时代,自然中许多物理反应过程在现代企业环境中变的更加复杂、强大、危险,由此催生了基于实时物理信号的自动化产业,因为如果还是按农业时代的“自然”方式处理这些过程,就会在生产中发生许多爆炸灾难。现在,我们正从工业走向知业时代,社会中的许多组织过程在网络环境中也变得更加动态复杂,“大数据”实际上揭示了实时“社会信号”的到来,也必将催发未来的新型社会管理产业。知识自动化、社会及文化资源规划SRP和CRP等系统只是滥觞,我们必须尽快利用大数据,特别是以微信微博为代表的社会信号,创新社会管理,开发出各种各样的社会管理和服务系统。否则,就像工业生产没有自动化就不能提高产能且容易产生事故,不利于新型社会管理和服务系统及时处理,甚至无视社会信号,也可能在社会过程中产生许多“爆炸”,危害社会的健康发展。

 

实际上,十九世纪法国科学家安培提出控制论一词的原意就是科学地进行国务与社会事务的管理,只是当时还没有大数据和社会信号,但已经有了工业生产中的物理信号,因此只能把控制论思想用于工业控制,使工业社会得以实现。今天,网络技术、信息理论、智能系统已经把大数据和社会信号洪水般地推向几乎每个人的面前,“堵”已太晚也根本不可能,我们必须尽快将其作为“矿藏”加以认识利用,创新社会和经济管理,实现“知业革命”,从而更有效地服务人类,向更加开放,繁荣、公正的社会迈进。


http://www.rmlt.com.cn/2014/0611/278259.shtml

“数据矿藏”对于“知业革命”的意义


另一中国社会科学 报的报道稿, 存此


学术清风脱然至,切莫见别萧艾中

 

本报记者 谢方

 

    学术界的道德失范现象到底有多严重?失范现象为何愈演愈烈?这是每每提及便会让人“痛心疾首”的话题。在94岁高龄的北京大学哲学系教授张世英看来,学术道德示范屡禁不止,并不归咎于个别学者,而是有着深刻的历史渊源。在当下,谁能做到不戚戚于贫贱,不汲汲于富贵?“现在的大多数人太现实了啊!”张世英感慨道。当然,“不现实”的学者也存在:“为学术而学术”的学术精神与学术清风,古往今来从未被淹没。

 

自然科学研究,是追求也是责任

从质疑教育系统硬性地规定在读硕士、博士发表论文数目,发出“SCI,谁的悲哀”的感叹,再到对引进人才如何处理“名与实”关系问题的直言不讳,作为敢想敢言的有为“海龟”,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃,对学术腐败现象一直颇有感慨。然而此次,王飞跃只是笑着对记者摇了摇头,“我现在属于俄国大革命前的‘第三种人’或‘第三种知识分子’,奉行阿勃拉莫夫的‘小事理论’。实验室有几百科研人员,我只能一方面专注自己的研究,一方面思考如何让员工生活的好。我们是管理领域的第一个国家重点实验室,中国的管理之祖管子早说过:‘仓廪实而知礼节,衣食足而知荣辱’”。之所以持这种态度,他认为我们传统上喜欢提“高大全”的理想化要求,动辄“以天为宗,以德为本”,又对“名”特别重视,还要“名副其实”,可这个“实”往往像天一样高、地一样大、世界一样全,做不到只能“作”,因此产生了许多问题,结果就是“倒名为实”的“现”实。而且,长期造成的现实,不应也不能要求在很短时间里改成,否则可能会使情况更坏。他说:“孔子要求‘名正言顺’,但有时我们忘了接下来的话是‘名之必可言也,言之必可行也’,这也就是为什么波普尔提倡‘零星社会工程’的原因吧。”

 

王飞跃非常忙,忙于研究与推广社会计算这一新兴领域。他告诉记者,从浙江大学毕业到美国留学,再到获得美国亚利桑那大学终身教授职位,自己是改革开放的受益者。在美国学习工作二十多年,他时时都希望能为国家的发展尽自己的薄力。1998年,他只身一人于中国科学院自动化研究所创立了智能控制与系统工程中心。“其实,在国外不回来不一定就是不爱国,回国了也不一定就表示这个人爱国”,王飞跃说,从美国回来在国内踏踏实实做研究,更多地是出于责任感。

中国社会科学院世界历史研究所所长张顺洪在接受本报记者采访时曾说,“我国老一辈学者,在极其艰苦的条件下,开创社会主义学术事业,艰苦奋斗,筚路蓝缕,无私奉献,忠心报国,涌现出许多令人敬仰的人物”,那么,王飞跃的首位硕士导师,已故的著名力学家王仁东,便是这众多人物之一。

王仁东曾留学美国,并在新中国成立后第二天回到祖国,之后到浙江大学任教,他在大型回转窑筒体应力计算和破碎理论方面做出过重要贡献。王飞跃回忆,先生一生光明磊落,刚毅坚强,敢于坚持真理、讲真话。他治学的最大特点就是理论联系实际。王仁东对工厂、企业的求助者从不拒绝,总是全力以赴地帮助他们解决生产上的难题,常常奔波在祖国各地的厂矿企业、设计和研究单位。辛勤的劳动,使化工机械当时这一新兴学科很快就被深入浅出地介绍到了国内科技界,起到了很好的启蒙作用。王飞跃表示,先生留给他最深的印象是他对中华民族的挚爱和“老骥伏枥,志在千里”的雄心。用王仁东自己的话说就是:“活到老,学到老,工作到老;生命不息,战斗不止。”

如今,“我从先生身上学到的专业知识已经淡忘,研究领域也相去深远,但先生对民族的热爱和敬业的精神,我将受益终生”,王飞跃说。他表示,我国科技发展的确取得了很大进步,历史上还曾经长期领先世界。选拔人才的方式从杀而优则仕,到血而优则仕,再到学而优则仕,已有了飞跃。“我希望将来是效而优则仕,这个‘效’是有效的效、效率的效”。

 

做人文社会科学,要耐得住寂寞

其实,不仅自然科学研究的学者需要实践与艰苦奋斗,正所谓“读万卷书,行万里路”,人文社会科学领域的研究工作亦是如此。那么,如何能踏踏实实地做学问?

“一个人想要认真做学问,必须耐得住寂寞,而耐得住寂寞却是极难做到的”,如今已是耄耋之年的辽宁省文物考古研究所名誉所长郭大顺告诉记者。自1968年毕业开始,郭大顺就为考古事业奋斗至今。他说,年轻时的经历都写在了《探索古辽西——考古人和他们的故事》这本书里。在书中,曾从事过考古研究的当代作家张承志写道,“考古人……往往出自著名的学府,却像老农一样在土里挖掘寻找;他们‘读尽了相关的每一条史料,也走遍了相关的每条河谷’;他们直面日常工作的辛苦与琐碎,奉现给人们的却是废墟上的辉煌与田野里的诗意。”

郭大顺说,根据他多年的考古工作经验,他认为,唯有对自己的专业充满兴趣,才能化寂寞为动力,最终坚持下来。考古学研究是一门辛苦的工作,需要大量的田野实践。“现在的考古工作多以车代步了,我并不提倡这种做法,因为考古调查是需要‘走’的,只有在走的过程中才能有所发现,看到整体的环境以及当时人的生活状态”。虽然研究过程很辛苦,但这种钻研中也有乐趣:钻研之后最终得到自己的结论,这个过程本身充满乐趣。实践虽辛苦,但有实践才能有收获。

“考古挖掘出来的文物,不光是一件物品,它包含着的是一种思维,也就是‘考古的哲学化’”,郭大顺的言语中无不表达出对考古这一事业的热爱。他认为,从事民族考古学的人应学习国外同行的研究方法和经验,但同时也应精读中国古籍,不仅为了搜寻有用资料,而且可从古人治学精神中汲取营养。中国古代就不乏有学者走出书斋,接触社会,如明末清初的学者顾炎武。他研究中国古代社会制度、历史和地理即重视调查,到各地游历和调查时又不忘读书,其“竹笈双驮万卷书”的故事,永远激励着今天的学者们。

 

“为学术而学术”的学术精神永不过时

“学术界的很多歪风邪气源于一些学者的欲望太深,缺少自我啊”,张世英向记者感慨。他告诉记者,并非是想吹嘘自己。







http://blog.sciencenet.cn/blog-2374-803043.html

上一篇:[转载]中国拿走了美国的镇国之宝
下一篇:[转载]《自动化学报》40卷5期网刊已经发布, 敬请关注, 谢谢:)

26 陈德旺 许培扬 罗汉江 赵斌 曾宇怀 吕秀齐 武夷山 陆浩 李本先 彭真明 薛宇 李宇斌 孙学军 李伟钢 黄智生 张骥 董洁林 刘钢 洪昆辉 刘灵通 刘艳芳 陈敬朴 王启云 biofans yunmu rosejump

该博文允许注册用户评论 请点击登录 评论 (20 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2018-10-16 01:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部