XLiblog的个人博客分享 http://blog.sciencenet.cn/u/XLiblog

博文

与师生谈科学之弊6:不牢靠的因果推理 精选

已有 8624 次阅读 2013-6-11 11:04 |系统分类:教学心得

学:学生,教:教师,李:李晓榕。

 

李:如上所述,严格的因果观在科学实践中可以说已名存实亡。现在让我们看看概率因果律。令e为“因”(或证据、前提),h为“果”(或假设、结论),ē表示“e为假”, $\overline{h}$ 表示“h为假”。如何确定“由e得出h”这一不确定推理(或因果律)“e → h”的好坏?以亨普尔(Carl Hempel)为代表的研究者认为,给定e,如果h的条件概率P{h|e} = r很大,就可认为:e以很大的程度r支持h,或者说推理“e → h”为真的可能度r很大。这一原理似乎相当有理,因而被广为采用,包括众多的工程领域,并把r当成“e → h”的归纳概率,即定义P{e → h} := P{h|e}。然而,这一原理有严重不足。首先很明显,如果r不大,该原理一般失效。另一方面,要求“r很大”既无必要,也不充分。①先说必要性。有位绝症患者,如不开刀,必死无疑,但开刀(e)的成功率只有20%。开刀后不久,患者痊愈(h)了,此时,尽管条件概率P{h|e} = r = 20%根本不大,我们仍有极大的把握认为,正是e(开刀)导致了h(痊愈)。贝叶斯学派对此可以提出不少质疑和异议,比如说要看后验概率P{e|h},而不是条件概率P{h|e}。注意,我们这儿仅限于谈条件概率。②再说充分性:其实,即便r很大,该原理也未必合理。有一批流感患者,服用同一种药(e)十天之后,90%的人痊愈(h)了,即P{h|e} = r = 90%,我们能否认为,这种药的治愈率是90%?不能!因为其实即便不服这种药(ē),这批患者的自动痊愈率也可能高达85%甚至95%,即P{h|ē} = 85%~95%。所以上述原理并不可靠,不该乱用。其实,要无懈可击地量化推理“e → h”的可靠度是极其困难乃至不可能的

   那么,退一步说,如何判定推理“e → h”是否合理?

学:这可以靠比较条件概率P{h|e}和P{ $\overline{h}$ |e}的大小来定,如果P{h|e} > P{ $\overline{h}$ |e},那么“e → h”是合理的,反之则不合理。

教:我认为,比较条件概率P{h|e}和P{h|ē}的大小更好,如果P{h|e} > P{h|ē},那么“e → h”是合理的,反之则不合理。

李:比较P{h|e}和P{ $\overline{h}$ |e}的大小,在不少理工科领域很常用。比如,所谓最大后验概率(MAP)原理就说,如果h*在所有可能的h中的概率最大(即P{h*|e} = max P{h|e}),那么可以认为e支持h*。一种常用统计假设检验,——MAP检验就是基于这一原理的。这一方法有严重缺陷,略微修改上述流感之例,就可以得到一个反例。

   如果h和e统计独立,那么P{h|e} = P{h} = P{h|ē}。而P{h|e} > P{h|ē}则意味着P{h|e} > P{h} > P{h|ē},即h和e有统计正相关。(或者更专业一点,如果P{h, b|e} > P{h, b},那么在条件b下,e是h的正面证据。)所以,比较P{h|e}和P{h|ē}的大小,很常用,比如,它是医学研究的标准方法。但是,它也有严重问题,详见下例。考虑一个判定某药是否有效的研究。有两个团队分别针对男性和女性病人,做了实验,结果得到以下二表。

左上表说明,条件概率P{恢复|未用药, 男性} = 0.7 > 0.6 = P{恢复|用药, 男性},所以用药对男性无效。同理,右上表说明, P{恢复|未用药, 女性} > P{恢复|用药, 女性},所以用药对女性也无效。所以,这两个团队的研究结论都是:该药无效(或者严格地说,该药有碍于恢复)。制药公司把这两个表内的数据合并起来,得到下表。

令人震惊的是,按该表,P{恢复|未用药} < P{恢复|用药},所以制药公司得出结论:该药对男性和女性总体有效!这一相反的结论与两个团队所得结论用的是相同的数据和相同的推理方法。这种推理是大多数临床和其它医学研究的逻辑基础。你还相信医学发现吗?这种推理也是社会科学研究的逻辑基础。这个例子是所谓辛普森悖论(Simpson’s paradox)。

教:问题是不是出在两个团队所用的样本大小不同?对男性用了(300,100),而对女性却用了(100,300)。这样它们各自的权重就不同了。

李:确实有关。但是,在实际中要求各团队用相同大小的样本,既没充分道理,又不现实。

学:我认为,在这个例子中,两个团队的结论是对的,制药公司的结论是错的,因为不存在同时是男性和女性的人,所以悖论不成立。

李:不妨把上述的“男性”、“女性”和“男女总和”分别改为“2010年的病人”、“2011年的病人”和“2010年和2011年的病人总和”。那么,你说的问题将不存在,而悖论仍然存在。这个悖论披露了这种推理的深层缺陷,它至少说明,单靠比较条件概率P{h|e}和P{h|ē}的大小,这种推理不自洽,因为要克服上述悖论,就得用这两个条件概率之外的信息。

 

正在出的博文系列:

与师生谈现代化之弊

1:崛起的代价                                                  2:发展必好无疑?


与师生漫谈科研

1:我有科研之才吗?                                            2:我该做科研吗?

3:逻辑推理的作用                                              4:人生价值

5:生命的延续                                                  


已出博文系列:

与师生谈科学之弊

1:线式因果思维1                                               2:线式因果思维2

3:线式因果思维3                                               4:螺环之奇妙

5:幻化的因果                                                  6:不牢靠的因果推理

7:分析还原病                                                  8:还原论教条

9:基因未必基因                                                10:割根裂本

11:强拆硬分                                                   12:科学的领地

13:科学的致命伤                                               14:科学的致命伤2

15:逻辑之可错                                                 16:逻辑可错之源

17:“脚踏实地”的逻辑?                                       18:逻辑:真理焉?宗教焉?

19:想不清原理                                                 20:想不清原理2

21:逻辑教的改革                                               22:逻辑教的改革2

23:精确性的终结                                               24:科学哲学

25:务外逐物                                                   26:科学六弊

27:科学之弊总结


与师生谈科研选题:

1:科研的战略、战术和战斗力                                    2:选题三准则:趋喜避厌

3:选题三准则:如何培养兴趣                                    4:选题三准则:择重舍轻,扬长避短

5:得题之关键                                                  6:如何应对新潮

7:选题四建议                                                  8:总结:选题好比找对象


与师生谈研究策略:

1:科研四要素                                                  2:突出重围的法门

3:人人信之而善忘的黄金法则                                    4:孤胆方是英雄,独创才有真才

5:大道至简,科学之魄                                          6:弃繁就简

7:以特制胜                                                    8:综括

9:反行众道,改形换状                                          10:迷雾中的灯塔

11:技穷时的上策                                               12:驾驭时间之术1

13:驾驭时间之术2                                              14:保质增产之法

15:类比、联想、猜测、推证                                     16:评估

17:总结与回顾


与师生谈学习门径:

1:广度与深度                                                  2:增加深度的窍门1 

3:增加深度的窍门2                                             4:增加深度的窍门3

5:增加深度的窍门4                                             6:增加深度的窍门5

7:增加深度的窍门6                                             8:如何培养直觉和想象力?

9:基础不好,死路一条?                                        10:阅读策略1

11:阅读策略2                                                  12:博览之术

13:增强记忆1                                                  14:增强记忆2

15:如何听讲                                                   16:最佳捷径


与师生谈科研输出:

1:论文写作五要点                                              2:论文的结构、条理和语言

3:标题、摘要、引言、结论                                      4:作学术报告四建议

5:与编审人员打交道


与师生谈科研道德:

1:何谓弄虚作假                                                2:何谓剽窃?

3:何谓自我剽窃?                                              4:版权

5:谁该当作者?                                                6:署名顺序怎么定?

7:其他学术不当行为                                            8:总结

上一篇 下一篇



http://blog.sciencenet.cn/blog-687793-698378.html

上一篇:与师生谈科学之弊4:螺环之奇妙
下一篇:与师生漫谈科研1:我有科研之才吗?

15 郑小康 徐大彬 王国强 田云川 应行仁 李伟钢 王林平 李宇斌 王庭 高建国 陆泽橼 杨正瓴 ccgoodluck Allanmu cccy

该博文允许注册用户评论 请点击登录 评论 (21 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-11-29 20:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部