闵应骅的博客分享 http://blog.sciencenet.cn/u/ymin 一位IEEE终身Fellow对信息科学及其发展的看法

博文

是先有结论,还是先有数据?(130715) 精选

已有 8828 次阅读 2013-7-15 08:42 |个人分类:网络|系统分类:科研笔记| 统计, 污染, 寿命

是先有结论,还是先有数据?(130715

闵应骅

 

   最近,一则新闻很夺人眼球:《美国国家科学院学报》发表MIT和北大、清华教授的研究报告称,与生活在南方的居民相比,空气污染使中国北方居民的人均预期寿命减少5.5年。政府马上表态,中国环境保护部一位官员回应,上述结论缺乏实证,有失偏颇,没有大量样本得出这个结论不可信。但有人说:空气污染会影响人的寿命,似乎也可以理解。这就引出一个问题:是先有这5.5年的数据,才得出空气污染影响人的寿命的结论呢?还是先有了结论才得出这5.5年的数据呢?

   美国麻省理工学院2012年发表报告称,中国2005年因空气污染造成的损失达1120亿美元。而世界银行的数据显示,当前中国由于空气污染导致的经济损失至少相当于GDP1.2%。这些数据又是怎么得到的呢?美国《纽约时报》等媒体8日报道称,一项最新研究显示,居住在淮河以北的五亿中国人由于室外空气污染将总共丧失25亿年的预期寿命,即中国北方人的预期寿命平均比南方人少5.5年,原因是北方普遍使用煤炭取暖导致空气污染,对人体心肺功能造成破坏性影响。据说该论文的研究基于中国特有的冬季取暖政策:其以取暖分界的淮河为准,选取了淮河以北和淮河以南90座城市,收集了1981年到2000年间这些城市每日的总悬浮颗粒物浓度数据,以及疾控系统得到的1991年到2000年这些城市的各年龄段死亡率、预期寿命和死于心肺疾病的数据。论文另一作者李宏彬解释,因为南北供暖政策,研究者发现在淮河附近污染曲线出现大幅的跳跃原来是平滑的一条线,到了淮河附近突然有个跳跃,曲线不连续了。研究发现,淮河北岸的总悬浮颗粒物比相邻的南岸跳跃性地高出了200微克/立方米,相应地,人均寿命也发生了突变,北方比南方少五年之多。

   看来,他们是先收集数据,然后经推理,得到这5.5年的数据。可是,这些原始数据有许多可疑的地方。首先,城市每日的总悬浮颗粒物浓度数据是否可靠,测试设备和测量结果在这10年中是否一致?我常见,现在美国大使馆和北京当地测出的PM2.5的数据就常常不一致,甚至差别很大。死亡率的统计也很复杂,不能说死于心肺疾病就是空气污染导致的,更不能说是因为用煤取暖导致的。最难的是怎么把空气污染的数据转换为寿命的增量?是个什么函数关系?那些曲线是否连续,并不是实测的,而是人画的。所以,统计是门大学问。怎么从繁琐的数据中找出知识来,得出可靠的结论?大有研究的空间。

   从另一角度看,空气污染会影响人的寿命这一结论还是令人可以接受的。但是,找些数据来表明这一结论如何骇人听闻就值得怀疑。整个推理过程经不起推敲。但是,这种现象还真经常有。甚至出现许多大家不懂的新名词,加上一些不知转换过多少次的数据,验证自己的结论正确。这常常缺乏说服力,但对一些比较缺乏知识和思考的群众,却能起到宣传作用。

   胡适之先生教导我们说要“大胆假设,小心求证”。毛主席教导我们说理论要从实践中来。科学研究应该从实验数据出发,得出科学结论。任意修改试验数据、论文造假的学术不端行为必须坚决反对。这也是我们民族求真务实的文化需求。

 



https://blog.sciencenet.cn/blog-290937-708222.html

上一篇:智能化和自动化会减少就业吗?(130706)
下一篇:神奇的π(130722)
收藏 IP: 111.161.79.*| 热度|

17 刘钢 庄世宇 应行仁 曹聪 水迎波 孙学军 李宇斌 王启云 李伟钢 蒋大和 杨顺楷 赵凤光 许培扬 王满喜 俞立 曾新林 dulizhi95

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-17 19:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部