中国海洋分享 http://blog.sciencenet.cn/u/ysf6 生态管理缔造美丽海洋

博文

[转载]统计的艺术:数据洪流与陷阱

已有 2201 次阅读 2019-6-9 08:57 |个人分类:学术论文|系统分类:论文交流|文章来源:转载

统计的艺术:数据洪流与陷阱

来源: Nature自然科研 Nature自然科研 2019-06-09

原文作者:Evelyn Lamb

作者高度评价了书中对于统计及其广泛应用的深入解读。

《统计的艺术:从数据中学习》(The Art of Statistics: Learning from Data)David Spiegelhalter Pelican (2019)

所有的模型都是错的,但有些模型却是有用的”,这句老生常谈的话其实不无道理。统计学家George Box 的这句至理名言直指许多领域科学家所面对的一个核心挑战——这个世界如此复杂,远不是一个数学模型、科学模型或统计模型所能概括的。纵然关于这个世界的模型并不完美,但从药物有效性到失业状况调查,如果要得出一个结论,这些模型必不可少。在这本《统计的艺术》中,作者David Spiegelhalter告诉我们应该如何利用不断涌入的数据洪流,提升我们对这个世界的理解,同时帮助我们认识在做此尝试时可能遇到的一些陷阱。


如果没有掌握系统性的统计方法,数据跟踪可能让人望而生畏。

来源:solarseven/Getty

《统计的艺术》一书顺应了当下强调概念理解而非计算流畅性的统计学教育理论。如今的统计软件只消一眨眼的功夫,就能轻松完成各种测试,搞定大型数据集的任何测量运算。正是因为如此,与其学习如何计算样本的标准偏差,更重要的是学会如何用严密的逻辑去设计研究、解读研究结果


Spiegelhalter在书中一再强调了“PPDAC”结构的重要性,即“问题-计划-数据-分析-结论”。他讲述了统计学家会如何处理一项研究的各个部分,并相应选择哪些工具。PPDAC先从定义问题开始,再制定计划,包括决定测量什么、如何测量以及哪种分析方式最合适。之后,研究人员会收集数据,根据计划开展分析,并最终判断哪种结论比较合理。


Spiegelhalter是业内饶有建树的统计学家,书中一些最有意思的地方是他讲述的幕后故事,比如他和同事在研究过程中所做的决定。有一次,他要带领一个团队统计英国医院接受心脏手术儿童的死亡率。即便是那些看起来没有歧义的数字,比如接受心脏手术的儿童的数量以及术后死亡人数,其数据来源和定义也存在着差异。


如何处理潜在歧义和极端案例可能会对最终结果产生巨大影响。举例来说,术后多长时间内的死亡应归因于手术?既然要做到完全清楚和客观是不可能的,那么就要让这些研究的读者意识到会让问题复杂化的潜在因素,哪怕只是为了让他们不要盲目相信某项研究结果。对于那些必须判断非正常死亡人数是否指向违法或失职行为的政治官员或陪审员来说,这一点尤其重要。


这些例子告诉我们,要对已知事物保持审慎的信任态度——这也是本书的核心思想。Spiegelhalter在书中写道,统计科学的目的是帮助我们由对照研究进行外推,从而了解这个真实的世界,“最后能够以谦逊的口吻说,我们可以从数据中得到什么,不能得到什么”。当统计学被用来辩论癌症筛查的成本与收益这类具有争议的问题时,人们缺少的正是这种谦逊的态度。

划重点

本书非常出色的一点在于,它用有限的篇幅探讨了大量基础问题。有些概念或许值得进一步深入,尤其是自举法(bootstrapping),亦即在随机重抽样的基础上预计统计数值的分布情况;还有中心极限定理:随着抽取的数据样本量不断增大,其均值趋向于正态分布。当然,作者在决定对哪些问题做进一步展开时,却是经过了一番取舍。试想一本涵盖了各种回归、零假设检验、贝叶斯推断等概念的书是多么艰涩难懂。不过,对于那些想要进一步深挖的读者来说,书中提供了非常详实的注释和参考目录。


作者并没有回避统计学的一些细节问题,比如各种不确定性的性质。正如他在第九章开头所告诫的那样,当数学概率论的车轮驶上统计推断的大道时,即使是那些科学素养较高的读者也会感到非常挑战。有些段落可能需要读者自备笔纸,来来回回读几遍才能完全消化,但是书中的一些宏观解释以及每一章最后的总结还是比较易懂的,此外还有非常有用的词汇表。


本书的结尾指出,许多存疑的统计方式在一定程度上造成了今天大部分学科正面临的重复性危机。作者认为科学家和记者可以一起努力,一方开展更好的研究,另一方进行负责任的报道,共同提高公众的认识水平。经过一系列艰深的统计学科普之后,读者可以立即将这些非常实用的建议转化为行动。


《统计的艺术》是一本优秀的学生读物。对于渴望以认真负责的态度使用统计学的记者来说,以及那些希望带着积极的批判性眼光去看问题的人来说,阅读此书将获益匪浅。

原文以The joy of stats为标题

发布在2019年3月25日《自然》书籍与艺术上


Nature|doi:10.1038/d41586-019-00898-0

版权声明:

本文由施普林格·自然上海办公室负责翻译。中文内容仅供参考,一切内容以英文原版为准。欢迎转发至朋友圈,如需转载,请邮件China@nature.com。未经授权的翻译是侵权行为,版权方将保留追究法律责任的权利。


© 2019 Springer Nature Limited. All Rights Reserved

-----------------------------------------------------------------------

《海洋生态大讲堂》微信公众号

浙江省重点智库宁波大学东海研究院合作微媒平台


海洋在说话,您我来代言!

《海洋生态大讲堂》欢迎您!

投稿邮箱:550931758@qq.com

请您在留言中标注为《海洋生态大讲堂》投稿,

并提供个人简历及联系方式。

我们筛选审核后,将以全文刊出!

热烈欢迎广大自愿者合伙参与公众号运营!


                附: 投稿类型与要求

                (1)主题一定是有关海洋生态学内容的稿件;

                (2)原创文章,请配必要的图表;

                (3)好文推荐,直接发来原文,或请注明出处;

                (4)重要会议报道或信息,请附必要图表及其标题说明;

                (5)重大项目科研进展,或重大会议学术报告PPT;

                (6)重点团队介绍,或重要人物专访。


您的赞赏是我们前行的最大动力




https://blog.sciencenet.cn/blog-1721-1183898.html

上一篇:[转载]跨学科研究中容易出现的4个问题
下一篇:[转载]我国将建立国家技术安全管理清单制度
收藏 IP: 180.164.35.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 05:12

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部