maohelu的个人博客分享 http://blog.sciencenet.cn/u/maohelu

博文

大数据时代(5)

已有 3126 次阅读 2016-11-11 15:26 |个人分类:读书笔记|系统分类:科研笔记| 大数据时代

数据化:一切皆可“量化”

信息技术变革随处可见,但是如今的信息技术变革的重点在“技术”上,不在“信息”上。

大数据最早实践之一的莫里导航图向我们说明远在信息数字化之前,对数据的运用就已经开始了。很多事例表明,数据可以从最不可能的地方提取出来。但这里应该区分两个概念,“数据化”和“数字化”。数据代表着对某件事物的描述,数据可以记录、分析和重组它。我们总是把数据化当成数字化,两者是完全不同的概念,数据化是指把现象转变为可制表分析的量化形式的过程。而数字化是指把模拟数据转换成用01表示的二进制码,这样电脑就可以处理这些数据了。书中举了个例子来帮我们理解这两个概念,谷歌在2004年的时候,开始将所有版权允许的书本内容进行数字化,即将每一页都被扫描,然后存储在服务器的一个高分辨率数字图像文件中。书本上的内容完成了网络上的数字文本,方便了人们的查阅,但是它不能做到根据关键词来搜索自己感兴趣的内容,因为这些数字文本没有被数据化,谷歌拥有的只是一些图像,因此,谷歌使用了能识别数字图像的光学字符识别软件来识别文本中的字,如此一来,书页的数字化图像就转化成了数据化文本。

一旦世界被数据化,就只有你想不到,而没有信息做不到的事情了。在大数据时代,惊喜无处不在!我最喜欢这句话。回头我们生活中大数据的例子,你总是会惊讶的发出赞叹,好棒!



https://blog.sciencenet.cn/blog-916405-1014151.html

上一篇:大数据时代(4)
下一篇:大数据时代(6)
收藏 IP: 27.223.77.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 00:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部