nqed的个人博客分享 http://blog.sciencenet.cn/u/nqed

博文

关于真实得病概率问题

已有 13840 次阅读 2017-4-2 00:25 |系统分类:博客资讯

关于真实得病概率问题

首先是有张天蓉博主的一篇概率论悖论”http://blog.sciencenet.cn/blog-677221-1042909.html

其中有如下一段话:

--------------------------------------

基本比率谬误(base rate fallacy

先看一个生活中的例子。

王宏去医院作验血实验,检查他患上了X疾病的可能性,其结果居然为阳性,把他吓了一大跳,赶忙到网上查询。网上的资料说,实验总是有误差的,这种实验有“百分之一的假阳性率和百分之一的假阴性率”。这句话的意思是说,在得病的人中做实验,有1%的人是假阳性,99%的人是真阳性。而在未得病的人中做实验,有1%的人是假阴性,99%的人是真阴性。于是,王宏根据这种解释,估计他自己得了X疾病的可能性(即概率)为99%。王宏想,既然只有百分之一的假阳性率,那么,百分之九十九都是真阳性,那我已被感染X病的概率便应该是99%

可是,医生却告诉他,他被感染的概率只有0.09左右。这是怎么回事呢?王宏的思路误区在哪里?

医生说:“百分之九十九?哪有那么大的感染几率啊。99%是测试的准确性,不是你得病的概率。你忘了一件事:这种X疾病的正常比例是不大的,1000个人中只有一个人有X病。”

医生的计算方法是这样的:因为测试的误报率是1%1000个人将有10个被报为“假阳性”,而根据X病在人口中的比例(1/1000=0.1%),真阳性只有1个。所以,大约11个测试为阳性的人中只有一个是真阳性(有病)的,因此,王宏被感染的几率是大约1/11,即0.09(9%)

王宏想来想去仍感糊涂,但这件事激发了王宏去重温他之前学过的概率论。经过反复阅读,再思考琢磨医生的算法之后,他明白了自己是犯了那种叫做“基本比率谬误”的错误,即忘记使用“X病在人口中的基本比例(1/1000)这个事实。

------------------------------------

高山博主不同意,发表了一篇博文:“有关科学网一篇概率问题的再讨论”,

http://blog.sciencenet.cn/blog-907017-1043054.html

高山说,王宏最初认为的99%是对的,医生计算的9%是不对的。而且留言希望我支持他的观点。

老实说,我对概率论只通六窍,今天之前也不知道贝叶斯是谁。但是这个问题看上去很有趣,似乎违反常识,何不乘此机会学习一点概率论?

数学家当然是对的,可是他们写的东西照例很抽象难懂。我且试试能不能把这个问题用简单的语言说清楚,让老百姓也能懂。


先看看几个名词的定义:

1. 临床特异度是衡量试验正确地判定无病者的能力,特异度是将实际无病的人正确地判定为阴性的比例。

2. 临床灵敏度可用来衡量某种试验检测出有病者的能力,灵敏度是将实际有病的人正确地判定为阳性的比例。

3. false negative proportion

假阴性率又称漏诊率或第Ⅱ类错误。指实际有病,但根据筛检试验被定为无病的百分比。它反映的是筛检试验漏诊病人的情况。

4. false positive proportion

假阳性率又称误诊率或第Ⅰ类错误。在科学实验或检测中,出现假阳性结果的几率。实际上无病,但根据筛检被判为有病的百分比。它反映的是筛检试验误诊病人的情况。

5.gold standard

所谓“金标准”是指当前临床医学界公认的诊断疾病的最可靠、最准确、最好的诊断方法,也称标准诊断方法。临床上常用的金标准有组织病理学检查(活检、尸检)、手术发现、影像诊断(CT、核磁共振、彩色B 超)、病原体的分离培养以及长期随访所得的结论。金标准一般是特异性诊断方法,可以正确区分为“有病”和“无病”。但目前金标准在诊断医学中的应用不是很多。


所以,首先是有一种或一些方法--金标准--来规定一个病人是有(某种)病还是没有病。可惜金标准由于种种原因通常不能普遍使用,临床上通常会有一些较简单,便宜的检验方法进行筛查。

把100个金标准病人的样品进行筛查,给出X个病人阳性(有病),Y个病人阴性。那么,X%就是灵敏度,Y%就是假阴性率(漏报率)。显然,X+Y=100。

把100个金标准无病人的样品进行筛查,给出A个病人阳性(有病),B个病人阴性。那么,B%就是特异度,A%就是假阳性率(误报率)。显然,A+B=100。


原文中的问题是,如果X=B=99,王宏检验结果是阳性,问王宏是真正有病(金标准病人)的概率是多少?

我们知道X,B,是对正问题有了确定的答案,我们对测试方法的性能有完全的了解。现在要解决的是逆问题,如果我们知道结果,我们能知道输入参数(有病,无病)的概率分布吗?

“常识”告诉王宏,他真正有病的概率就是X%(=99%)。

可是张天蓉介绍的概率论告诉我们,在这里“常识”不成立。要知道王宏真正有病的概率,我们还需要一个不可缺少的参数:人群中真正的病人的比率C。原文中假定C=0.1% 。

按照所给的参数,对100000个人进行筛查。其中有100个真正的病人,会报告99例阳性。其余的99900非病人,由于1%的误报率,会报告999例阳性。最终结果是,在99+999例阳性报告中,只有99个真正的病人。

王宏真正有病的概率,确实就是9% 。

不管高山博主多么自信,他这次错了!

张天蓉博文有一段:

网上的资料说,实验总是有误差的,这种实验有“百分之一的假阳性率和百分之一的假阴性率”。这句话的意思是说,在得病的人中做实验,有1%的人是假阳性,99%的人是真阳性。而在未得病的人中做实验,有1%的人是假阴性,99%的人是真阴性。

其中后半段有瑕疵。正确的说法是:这句话的意思是说,在得病的人中做实验,有1%的人是假阴性,99%的人是真阳性。而在未得病的人中做实验,有1%的人是假阳性,99%的人是真阴性。

顺便说一句,在此例中,100000-99-999=98002份阴性报告中,只有1个人是真正有病的.所以,阴性结果的可信度非常高。比较:阳性结果的可信度是9%。悬殊如此之大,是由于此例中人群中真正的病人的比率C=0.1%,很小。




概率问题与贝叶斯定理
https://blog.sciencenet.cn/blog-583426-1043106.html

上一篇:提倡:“各人自扫门前雪,莫议他人瓦上霜”
下一篇:为什么说“高山根本不懂贝叶斯统计”
收藏 IP: 114.254.45.*| 热度|

7 徐令予 范振英 杨正瓴 冯大诚 梅卫平 gaoshannankai yunmu

该博文允许注册用户评论 请点击登录 评论 (31 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-22 09:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部