小单老师分享 http://blog.sciencenet.cn/u/shanbowei 昨天的轰动,是今天的标定,是明天的背景

博文

“大数据”--长期趋势还是暂时现象

已有 4310 次阅读 2012-7-1 08:25 |系统分类:科研笔记| 大数据

        本期(2012年6期)的《中国计算机学会通讯》http://www.ccf.org.cn/sites/ccf/jsjtbbd.jsp?contentId=2679929345796探讨的主题是:大数据(big data)。
        可以说,既物联网、云计算之后,2012年最受计算机业界关注的问题就是“大数据”了。“大数据”:是指由于迅速涌现出的海量数据所带来的众多复杂问题,且该问题已使得现有的工具或算法在可容忍的时间限度内无法处理(来自:http://en.wikipedia.org/wiki/Big_data)。
       其实脱开专业解释,从我们日常的生活中也同样会感受到“大数据”现象铺面而来。上谷歌,上百度,任何一条搜索请求都会在瞬间带来成几百万条搜索结果的呈现;上淘宝,上当当,上京东买东西,呈现给顾客的产品信息量远远超过任何一座大商场百万倍;而至于在社交网站上,如QQ空间,人人网,新浪微博上,每秒钟的刷新都会带给用户大量新的信息。
        下面是一组“大数据”现象的典型例子:
  • 大型强子对撞机(LHC)在2010年总计产生了13Petabytes的数据;
  • 沃尔玛超市每小时处理超过1百万的用户业务,这些数据被导入数据库后将包含2.5Pdtabytes的数据量,是美国国会图书馆数据量的167倍
  • Facebook从其用户端处理400亿张图片
  • 全球公司的商业数据量,每1.2年翻一倍
  • 对人类基因进行解码,最初需要10年,而现在仅需要一周时间

        这期《通讯》的专题文章共有7篇,分别是:

  •  数据密集业务的挑战和机遇——“大数据”在工业界      
  •  海量数据技术在电信业务内应用      
  •  大数据的魔力      
  •  推荐引擎:信息暗海的领航员      
  •  有容乃大——大规模数据云端存储      
  •  应对生命科学的大数据挑战
  •  基于云计算的数据密集业务应用   

        文章作者都是大企业,业界以及学术届的重量级人物。

        这些文章讲述的很多事实对我们还是很有指导意义的。因为在互联网普及之前,其实我们一直都处在信息匮乏的时代(依稀记得我小时候,要在电报上发出一个字,就需要掏1毛钱,那可是两根冰棍的价钱啊!),想要获得信息是困难的,而需要处理的信息也是极其有限的,所以始终是将主要的精力放在如何获取信息上。而在互联网时代,海量数据可以瞬间获得,所以问题已经发生了转化,现在我们已经处于一个信息爆炸的时代,我们更重要的问题是如何把海量数据中对我们最有用,对我们最重要的信息提取出来

       学术界应该和企业界不相同,我们更应带从长期的发展来考虑,“大数据”到底是一个长期的发展趋势还是一个暂时现象,只有能够确切证实“大数据”是一个长期的发展趋势了,其实才真正值得从事基础研究工作的人们进入从而开展工作。

   

       



https://blog.sciencenet.cn/blog-219583-587710.html

上一篇:母校的学生毕业了,发来了自己的涂鸦
下一篇:从高考题目管窥哲学教育
收藏 IP: 125.76.215.*| 热度|

6 许培扬 赵美娣 苏力宏 徐硕 陈绥阳 李伟钢

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 15:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部