|
学:学生,教:教师,李:李晓榕。
李:如上所述,严格的因果观在科学实践中可以说已名存实亡。现在让我们看看概率因果律。令e为“因”(或证据、前提),h为“果”(或假设、结论),ē表示“e为假”, $\overline{h}$ 表示“h为假”。如何确定“由e得出h”这一不确定推理(或因果律)“e → h”的好坏?以亨普尔(Carl Hempel)为代表的研究者认为,给定e,如果h的条件概率P{h|e} = r很大,就可认为:e以很大的程度r支持h,或者说推理“e → h”为真的可能度r很大。这一原理似乎相当有理,因而被广为采用,包括众多的工程领域,并把r当成“e → h”的归纳概率,即定义P{e → h} := P{h|e}。然而,这一原理有严重不足。首先很明显,如果r不大,该原理一般失效。另一方面,要求“r很大”既无必要,也不充分。①先说必要性。有位绝症患者,如不开刀,必死无疑,但开刀(e)的成功率只有20%。开刀后不久,患者痊愈(h)了,此时,尽管条件概率P{h|e} = r = 20%根本不大,我们仍有极大的把握认为,正是e(开刀)导致了h(痊愈)。贝叶斯学派对此可以提出不少质疑和异议,比如说要看后验概率P{e|h},而不是条件概率P{h|e}。注意,我们这儿仅限于谈条件概率。②再说充分性:其实,即便r很大,该原理也未必合理。有一批流感患者,服用同一种药(e)十天之后,90%的人痊愈(h)了,即P{h|e} = r = 90%,我们能否认为,这种药的治愈率是90%?不能!因为其实即便不服这种药(ē),这批患者的自动痊愈率也可能高达85%甚至95%,即P{h|ē} = 85%~95%。所以上述原理并不可靠,不该乱用。其实,要无懈可击地量化推理“e → h”的可靠度是极其困难乃至不可能的。
那么,退一步说,如何判定推理“e → h”是否合理?
学:这可以靠比较条件概率P{h|e}和P{ $\overline{h}$ |e}的大小来定,如果P{h|e} > P{ $\overline{h}$ |e},那么“e → h”是合理的,反之则不合理。
教:我认为,比较条件概率P{h|e}和P{h|ē}的大小更好,如果P{h|e} > P{h|ē},那么“e → h”是合理的,反之则不合理。
李:比较P{h|e}和P{ $\overline{h}$ |e}的大小,在不少理工科领域很常用。比如,所谓最大后验概率(MAP)原理就说,如果h*在所有可能的h中的概率最大(即P{h*|e} = max P{h|e}),那么可以认为e支持h*。一种常用统计假设检验,——MAP检验就是基于这一原理的。这一方法有严重缺陷,略微修改上述流感之例,就可以得到一个反例。
如果h和e统计独立,那么P{h|e} = P{h} = P{h|ē}。而P{h|e} > P{h|ē}则意味着P{h|e} > P{h} > P{h|ē},即h和e有统计正相关。(或者更专业一点,如果P{h, b|e} > P{h, b},那么在条件b下,e是h的正面证据。)所以,比较P{h|e}和P{h|ē}的大小,很常用,比如,它是医学研究的标准方法。但是,它也有严重问题,详见下例。考虑一个判定某药是否有效的研究。有两个团队分别针对男性和女性病人,做了实验,结果得到以下二表。
左上表说明,条件概率P{恢复|未用药, 男性} = 0.7 > 0.6 = P{恢复|用药, 男性},所以用药对男性无效。同理,右上表说明, P{恢复|未用药, 女性} > P{恢复|用药, 女性},所以用药对女性也无效。所以,这两个团队的研究结论都是:该药无效(或者严格地说,该药有碍于恢复)。制药公司把这两个表内的数据合并起来,得到下表。
令人震惊的是,按该表,P{恢复|未用药} < P{恢复|用药},所以制药公司得出结论:该药对男性和女性总体有效!这一相反的结论与两个团队所得结论用的是相同的数据和相同的推理方法。这种推理是大多数临床和其它医学研究的逻辑基础。你还相信医学发现吗?这种推理也是社会科学研究的逻辑基础。这个例子是所谓辛普森悖论(Simpson’s paradox)。
教:问题是不是出在两个团队所用的样本大小不同?对男性用了(300,100),而对女性却用了(100,300)。这样它们各自的权重就不同了。
李:确实有关。但是,在实际中要求各团队用相同大小的样本,既没充分道理,又不现实。
学:我认为,在这个例子中,两个团队的结论是对的,制药公司的结论是错的,因为不存在同时是男性和女性的人,所以悖论不成立。
李:不妨把上述的“男性”、“女性”和“男女总和”分别改为“2010年的病人”、“2011年的病人”和“2010年和2011年的病人总和”。那么,你说的问题将不存在,而悖论仍然存在。这个悖论披露了这种推理的深层缺陷,它至少说明,单靠比较条件概率P{h|e}和P{h|ē}的大小,这种推理不自洽,因为要克服上述悖论,就得用这两个条件概率之外的信息。
正在出的博文系列:
与师生谈现代化之弊
与师生漫谈科研
5:生命的延续
已出博文系列:
与师生谈科学之弊
17:“脚踏实地”的逻辑? 18:逻辑:真理焉?宗教焉?
27:科学之弊总结
与师生谈科研选题:
3:选题三准则:如何培养兴趣 4:选题三准则:择重舍轻,扬长避短
7:选题四建议 8:总结:选题好比找对象
与师生谈研究策略:
3:人人信之而善忘的黄金法则 4:孤胆方是英雄,独创才有真才
15:类比、联想、猜测、推证 16:评估
17:总结与回顾
与师生谈学习门径:
7:增加深度的窍门6 8:如何培养直觉和想象力?
9:基础不好,死路一条? 10:阅读策略1
与师生谈科研输出:
1:论文写作五要点 2:论文的结构、条理和语言
3:标题、摘要、引言、结论 4:作学术报告四建议
5:与编审人员打交道
与师生谈科研道德:
上一篇 下一篇
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-20 07:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社