|||
人们有时会为了一个数学上可论证却小得没有意义的差别费尽了力气。这种行为是对这句古训的藐视:只有当差别有意义时才能称之为差别。
让人印象深刻的精确数据也会与现实相左。纽约报纸曾经报道:研究显示,一个与家庭住在一起的上班妇女需要40.13美元的日常支出。在读这张报纸时,任何人(只要没有完全丧失逻辑思考能力)就会意识到,物质和精神需要的费用加在一起是不可能精确到美分的。但是,人们又面临着一个致命的诱惑:总认为“40.13美元”比“大约40美元”更精确。
《统计陷阱》绪言
我岳父刚从爱荷华州到加利福尼亚州便对我说:“你们这儿治安不好。”在他所阅读的报纸中的确是这样描述的。但是,这种报纸以不轻易忽略当地发生的任何犯罪行为,并且以对于爱荷华州发生的谋杀案用比爱荷华州本地的主要报纸更多的笔墨进行大肆渲染而闻名
我岳父得出的这个结论是一个建立在明显有偏样本基础之上的随意的统计结论。类似于其他某些更为精致的统计结论,它也存在着证据与结果不匹配的问题。它假定报纸专栏中对犯罪行为的报道是测量犯罪率的工具。
几年前,十来个调查人员分别独立地发表了关于抗组织胺药物的数据。所有的数据都证明,在经过抗组织胺药物治疗后相当大比例的感冒能够治愈。这引起了传媒的大肆宣传,至少在广告中也是如此,并兴起了药物生产的热潮,这是因为人们长期以来对药物具有强烈的需求。但奇怪的是,人们拒绝越过统计去注意一下早就了解的事实。正如一位幽默的非医学权威人士,亨利·G.菲尔森( Henry G. Felsen)所指出的那样,服用上述药物的确能在一个星期内治愈感冒,但人们却忽略了另一个事实—即使不服用上述药物,一般而言,感冒也能在七天内痊愈。
你所见所闻的许多东西也和上面的事例一样。平均数、作用关系、趋势和图表与看上去的并不总是一致。虽然经验告诉我们“眼见为实”,但眼睛告诉我们的也许隐瞒了或者夸大了一部分事实。
统计这种神秘的语言,在一个用事实说话的社会里是如此的吸引人,但有时它却被利用并成为耸人听闻、恶意夸大或简化事实、迷惑他人的工具。在报告社会经济趋势、商业状况、民意测验和普查的大量数据时,统计方法或者统计术语是必不可少的。但如果作者不能正确理解并恰当地使用这些统计语言,而读者又并不能真正懂得这些术语的含义,那么,统计结果只能是一堆废话。
在通常的科学写作中充斥着被滥用的统计数据,以至于人们很难想到这些统计数据的背后有一个“白衣侠客”在昏暗的灯光下没日没夜地工作,就像一小撮药粉、一小瓶颜料,统计把一些重要的事实弄得似是而非。巧妙伪装的统计资料胜过希特勒的弥天大谎,虽然它也会引起人们的误解,却不会因此受到指责。
本书是一本如何利用统计以达到瞒天过海目的的入门读物。看上去,它很像骗子的行骗指南。但或许我可以模仿一个已退休的窃贼—在如何神不知、鬼不觉地撬开一把锁的方面,他的回忆录达到了研究生课程的水平—替这本书说句公道话:毕竟,骗子早就掌握了行骗的技巧,而诚实的人出于自卫也应该学会它。
统计陷阱 作者: [美] 达莱尔·哈夫
出版社: 上海财经大学出版社
原作名: How to Lie With Statistics
译者: 廖颖林
绪言
第一章 内在有偏的样本
第二章 精心挑选的平均数
第三章 没有披露的数据
第四章 毫无意义的工作
第五章 惊人的统计图形
第六章 平面图形
第七章 不相匹配的资料
第八章 相关关系与因果关系
第九章 如何进行统计操纵
第十章 对统计资料提出的五个问题
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 16:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社