人生的意义就是思考其意义分享 http://blog.sciencenet.cn/u/qianlivan 天体物理工作者,家乡云南昆明。

博文

统计量和图表——读《How to Lie with Statistics》

已有 3630 次阅读 2014-2-15 19:43 |个人分类:读书|系统分类:科研笔记| 统计

      各种图表已经成为大部分科研论文不可缺少的部分,而统计也广泛用于科学研究中。虽然大家都用统计,但是敢说自己懂得统计的人大概没有几个。这不仅是因为统计的内容纷繁复杂,而且即使是最简单的统计,很多时候也似是而非,经不起深究。而如果是报纸和新闻里的统计数据,那就更是一地鸡毛,乱七八糟了。
       如果科研论文上说,某个物理量的平均值是多少,那么必须指明是什么平均,最好是给出公式。如果只是说个“平均值”而没有别的交代,那么审稿人估计是不会同意的。而对于报纸和新闻,不管是统计局还是一般的记者,当他们说平均值的时候,鬼知道他们是怎么求出来的。《How to Lie with Statistics》有相当一段就在说这个问题。如果说一个概念而不给出此概念的具体定义,那么就相当于什么也没说。而报纸和新闻中总是这样的,很少给出某个概念的定义。所以大家听了新闻,知道了一堆名词,却不知道新闻在说什么。事实上,就“平均值”这个概念,可以有无穷多种含义,例如,通常所知的算术平均、几何平均,更宽泛地还包括中位数,加上各种不知名的加权平均,“平均值”是数不胜数的。而通常统计局和记者都不会告诉你,“平均值”指的是什么。所以,新闻上所说的“平均值”的绝对数量没有什么意义,相对数量倒是可以表明增加或减少,除此之外,再无意义。
       绝对量没有意义,相对量才有意义,这在物理中也是常有的事,比如势能的零点可以随便选取,有意义的是势能变化量。而对于新闻报道来说,相对量都不一定有意义,因为它们没有使用共同的基础,或者说共同的零点。比如,某疾病在某年发病数量比上一年增加了很多,这说明了什么?疾病防治出现问题了?其实真正的原因正好相反,是因为加大了疾病防治力度,使得发现并报告的病例数增加了。
       在科研中,如果一个统计量没有给出误差,并且对误差没有估计,那么审稿人是肯定不干的。而在新闻报导中就没这回事了,不给出统计量的定义,误差就更别想了。所以当新闻上说,北京的评价工资达到了9000元,科研民工们只能纷纷表示拖了大家的后腿。如果统计局敢给出这个统计量的定义和误差的话,一定可以看出,统计局是在吃白饭。
      书中还有很多内容和统计相关,但其实说的事情更宽泛。比如,偷换概念,这在任何领域都是普遍存在的。一个词,不同的人在不同的场合说出来,意思就不一样,如果不给出定义,那么不同的人也会有不同的理解——也就是会有误解。有些误解是无心之过,而有的误解就是偷换概念所想达到的目的了。上高中的时候,在很多别的老师让学生搞题海的时候,我的老师却极力强调要搞清楚基本概念,这是很对,到目前为止,我最清楚的还是高中那些概念,而且那些知识也学得最踏实。
       除了模糊的没有误差的统计量以及偷换概念,新闻中常用的伎俩还有图表。如果你光看图里的曲线,那么你基本都会被误导,一条急剧上升的曲线就表示急剧增加么?你有没有注意横坐标和纵坐标的单位是什么?有没有取对数?高中时的物理老师就告诫我们:拿到一幅图,先看横坐标和纵坐标,不这么做的,后果自负。新闻里还会出现一些钱袋子的卡通图表示钱的数量,但如《How to Lie with Statistics》中所说,很多时候,在表示两倍数量的钱的时候,钱袋子的高度和宽度(当然还是没有表现出来的厚度)是原来的两倍。看出问题来了么?
       另外一个重要的问题就是统计相关性的问题,在科研里也是一个有普遍性的问题。相关性不代表因果性!但是人们时常忘了这一点。我们需要注意的是,如果只有统计相关性,而没有进一步研究,那么我们所拥有的只有统计相关性本身而已!
       怎么才能在这纷繁复杂的世界里避免被统计(统计局和电视台)忽悠了呢?书中指出,每次问这么几个问题:
Who says so?
How does he know?
Did somebody change the subject?
Does it make sense?

 



https://blog.sciencenet.cn/blog-117333-767823.html

上一篇:国家的理想——读《理想国》
下一篇:金融中是否有物理?
收藏 IP: 123.113.35.*| 热度|

2 曹聪 苏光松

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-18 02:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部