|||
4月25日下午,在南京大学信息管理学院听了北京拓尔思信息技术股份有限公司施水才总裁“非结构化大数据处理技术及应用”的学术报告。他从大数据的理解、非结构化大数据处理的关键技术、拓尔思大数据技术和应用案例三个方面做了讲解。报告的大概情况可参见(http://blog.sciencenet.cn/home.php?mod=space&uid=668239&do=blog&id=684441)。
下面数据来自于报告中提及的涂子沛的《大数据》。原以为是介绍大数据技术方面的书,但它实际是讲述了美国半个多世纪以来,信息开放与技术创新的历史。书中详实的资料和数据很有启发功能。这两天准备把书中的一些内容进行一些整理,与大家分享。
“如果要考察信息的多少,就必须以物理存储器上保存的数据量作为度量。因为所有的信息都是以数据的形式保存在物理存储器上的。由于人类数据量不断增多,近几十年来,科学家也相应定义了一些新名词来表示新的存储单位,以方便对客观世界的描述。(p35-36)从书中图表(P318)看,到2011年,我国已经是世界是互联网用户和手机使用量最多的国家。2011年,麦肯锡公司以2012年度各国新增的存储器为基准,对全世界大数据的分布作了一个研究和统计,中国2010年新增的数据量为250拍,日本为400拍,欧洲为2000拍,美国为3500拍(P315-316)。相对而言,我国拥有的数据量绝对值还较小。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-29 11:39
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社