许培扬博客分享 http://blog.sciencenet.cn/u/xupeiyang 跟踪国际前沿 服务国内科研

博文

大数据----全是胡说八道

已有 3003 次阅读 2014-4-8 10:46 |个人分类:数据科学|系统分类:观点评述


大数据已是常规性应用了,什么春运大数据、两会大数据、清明大数据。。。。。。

但这篇文章说大数据是胡说八道,哈哈  哈哈!


大数据的鼓吹者们提出了四个令人兴奋的论断,每一个都能从谷歌流感趋势的成功中印证:

1) 数据分析可以生成惊人准确的结果;
2) 因为每一个数据点都可以被捕捉到, 所以可以彻底淘汰过去那种抽样统计的方法;
3) 不用再寻找现象背后的原因,我们只需要知道两者之间有统计相关性就行了;
4) 不再需要科学的或者统计的模型,”理论被终结了”。《连线》杂志2008年的一篇文章里豪情万丈的写到:“数据已经大到可以自己说出结论了“。

不幸的是,说的好听一些,上述信条都是极端乐观和过于简化了。如果说的难听一点,就像剑桥大学公共风险认知课的Winton教授(类似于国内的长江学者——译者注)David Spiegelhalter评论的那样,这四条都是“彻头彻尾的胡说八道”。

大数据,还是大错误?

http://article.yeeyan.org/view/47326/403015


大数据与制药行业的需求-汤森路透白皮书.pdf

各位好:
   刚刚收到《大数据与制药行业的需求-汤森路透白皮书》与大分享,希望能有所启发。
   《大数据与制药行业的需求》,探讨了制药行业如何应对当下大数据时代的挑战。我们认为,大数据时代问题与机遇并存。本文从一份针对制药行业的IT 领导人对大数据看法的调研开始,回顾了1960年代到2000年代的大数据发展趋势、总结了人们如何利用当前的大数据获取价值、并对未来的大数据——懂得提出问题并解答给出了预测与分析。将大数据化为小数据是应对大数据挑战的关键,破除内部、外部、公共和商业内容之间的壁垒,将多个来源的信息内容整合在一起,建立数据信息的流动和增加相关性,为分析提供动力,最终把内容转化为洞察力,支持发现更好的新药,才是真谛所在。
 
唐小利
中国医学科学院医学信息研究所/图书馆   信息服务部
地址:北京市东单北大街69号   邮编:100005
电话:010-52328902   传真:010-52328988


 



https://blog.sciencenet.cn/blog-280034-783008.html

上一篇:清明回老家,看到了很多“村老虎”
下一篇:一项国家任务被遗忘,车教授36年心血出成果
收藏 IP: 122.70.220.*| 热度|

3 侯成亚 蔡小宁 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (6 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-25 19:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部