cstor222的个人博客分享 http://blog.sciencenet.cn/u/cstor222

博文

大数据时代 读后感

已有 3923 次阅读 2014-9-5 14:59 |系统分类:博客资讯

 从实验室拿到这本书有阵子,最近找工作好几个面试官跟我提到这本书,其中有一个让我分享一下其中的一个案例。当时恰好看到那个案例,只是侃侃而谈了一些,不免觉得很空洞。今天打算通读一遍。

  读完这本书,对大数据有了一个比较宏观的认识。结合自己做的一些关于大数据相关的项目,谈点读后感。

  1. 大数据追求的是相关性,而非因果关系

  这个观点贯穿在整本书中,揭示了大数据比较核心的理念。这个观点跟我们追求的确切的结果,追求一种确切的由因到果的思维方式不同。在“小数据”时代,数据量少,产生一种结果往往要追根溯源到本质。在数据量比较小的时代,这种思维已经在我们的脑海中根深蒂固了,而在大数据时代需要转变这种思维方式。Google能通过分析数据来比较准确地预测流感,但是可能无法给出是什么原因导致的,只是一种趋势,有了这种趋势,人们可以有时间来采取措施防护。其实我有一个疑问:在利用大数据进行个性化推荐的时候,评价推荐系统的精确性的问题。如果我们只是追求相关性的话,如何来评价推荐系统的好坏呢?这里面应该包含了推荐的命中率,命中率是来自相关性的一种说法吗?

  2. 数据混杂是一个特征

  在大数据时代,我们会接收到各行各业的数据。这些数据有些是非结构化数据,数据混杂是一个特点。这本书中提到---“一切皆可量化”。不同的维度的数据在不同的情况下可以量化为不同的指标。。文中重点提到Google的翻译系统,领先于其他平台的翻译系统的重要原因就在于其数据的混杂,正是数据的混杂性,才会接收来自各行业、各种稀奇古怪的数据,再利用大数据的平台,可以提高翻译的精准性。

  3. 尽可能获取到更多的数据

  文中提到数据的二次利用,大数据利用这个可以发掘数据更多的潜在价值。很多公司虽然有数据,但是没法利用数据,有些公司没数据,但是有利用大数据的思维和技术,这也无形中产生了很多商机。文中提到大数据时代的受益公司主要是大公司跟小公司,大公司毫无疑问,本身自身有海量数据,数据来源不是问题,再加上相应的大数据思维,可以在行业保持领先。小公司有其灵活性,是其他公司所不能比拟的,加上大数据时代的利器在于思维和技术,而非存储和编程。所以小公司也许能做大数据时代的“土豪”,异军突起。

  尽可能收集到全局的数据,是大数据的一大追求。当然,文中也提到一个现实的问题,数据是无法被全部收集的。文中还提到了比如说基于地理位置的数据,可以大方异彩。

  4. 大数据的商业

  在书中提到了很多大数据的新兴产业,其中,个性化是大数据的一个热门的方向。亚马逊,Netflix,沃尔玛...都从个性化的推荐中受益。文中还提到大数据在医疗,交通,销售等领域的应用。

  5. 大数据时代的隐私

  大数据时代还有隐私可言么?呵呵,这点不可否认,像文中提到的对关键信息隐藏,加密等处理方法已经过时了。别忘记了,你在社交网络上的痕迹,别忘记了你的消费记录,别忘记了你浏览记录等等。大数据时代已经没什么隐私可言了。文中提到了转变对个人信息公平的看法的认知,提到了加强对数据二次利用的监控和管理。“谁用了谁负责”。

  6. “凡是过去,皆为序曲”

  这句话似乎说明过去很重要,过去记录的一切,会通过大数据的技术来分析历史数据。这句话也说明,大数据也开了一扇门,未来怎么发展,观其变,能把握变化的人能把握未来。

  以上纯属个人一些看法和观点。。




https://blog.sciencenet.cn/blog-1647341-825233.html

上一篇:大数据行业里的两大误区
下一篇:大数据概念及应用
收藏 IP: 58.213.47.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-18 11:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部