鲁晨光的科学和哲学研究分享 http://blog.sciencenet.cn/u/lcguang 兴趣:色觉, 哲学, 美学, 进化论,广义信息,投资组合

博文

新冠病毒检验的可信度和概率预测

已有 3713 次阅读 2020-2-11 15:44 |个人分类:疫情分析|系统分类:科普集锦| 新冠毒肺炎, 医学检验, 可信度, 概率预测

摘要:假设核酸检验敏感性是0.5, 特异性是0.9,被感染的基础概率是0.2;则作为检验手段,阳性的可信度是0.8,阴性的可信度是0.44;作为概率预测,阳性的可信度是0.21, 阴性的可信度是0.86.检验为阳性时,被感染的概率是0.56;检验为阴性时,被感染的概率是0.122.因为漏报率较高,有人提出用CT辅助确诊是合理的。 

抗病毒前线传来消息,核酸检验假阴性太多,这给救治和隔离带来极大困难, 有人因此提出要配合CT等手段确诊。本文做一科普,说明假阴性和假阳性是怎么回事, 根据阳性或阴性能做怎样的概率预测, 以及我们应当在多大程度上相信检验结果:阴性和阳性。

    设医学检验中,e1表示阳性,是对有病或被感染h1的预测;e0表示阴性,是对没病或没被感染h0的预测. 设e是变量,作为证据;h是变量,作为假设。则不确定关系如下:

test.jpg

                    图1 e和h的关系

概率P(e1|h1)叫做敏感性, 又叫真阳性率; P(e0|h0)叫特异性, 又叫真阴性率。敏感性和特异性反映检验手段好坏。P(e0|h1)=1-P(e1|h1)叫假阴性率,也就是漏报比例,这个比例越小越好。 P(e1|h0)是假阳性率,也就是误报比例,这个也是越小越好。 但是一个检验通常很难做到两者都小(参看下图)。漏报损失更大,所以漏报比例要小,这更加重要, 要优先考虑。

4P.jpg

                                图2. 四个条件概率和检验分界x'的关系

然而, 遗憾的是,目前核酸检验新冠毒肺炎, 敏感性只有0.3-0.5. 假设是0.5(参看 https://www.thepaper.cn/newsDetail_forward_5878994这意味着真感染者有一半要漏报。 有人会说既然它这么低为什么还要用? 医学检验中用阳性似然比反映阳性有多可靠:

        LR+= P(e1|h1)/P(e1|h0)=敏感性/(1-特异性)

只要特异性较大,LR+就大;根据阳性可以预测有病的概率就较大。比方说, 特异性是0.9(这是假设,我没有查到核酸检验的特异性), 那么阳性似然比LR+=0.5/(1-0.9)=5. 假设有疑似症状的人被感染的先验概率(又叫基础概率)是P(h1)=0.2(目前大概是0.2),那么可以算出

P(e1)=P(h1)P(e1|h1)+P(h0)P(e1|h0)=0.2*0.5+0.8*0.1=0.18;

P(e0)=0.82.

检查出阳性后,被感染的条件概率就是

            P(h1|e1)=P(h1)P(e1|h1)/[P(h1)P(e1|h1)+P(h0)P(e1|h0)]

                           =0.2*0.5/0.18=1/1.8=0.56.

被感染的概率从0.2增加到0.56, 所以检验有用。

    但是阳性也不完全可信。因为阳性的误报概率是P(h0|e1)=1-0.56=0.44. 这意味着没100个阳性者有44个不是真地被感染。 阴性也不完全可信,因为阳性患者中被感染和没被感染的概率是

        P(h1|e0)=P(h1)P(e0|h1)/P(e0)=0.2*0.5/0.81=0.122;

        P(h0|e0)=1- P(h1|e0)=0.878。

这意味着100个阴性的人当中有12.2个是被感染的。

    这就是为什么有医生呼吁要使用CT辅助确诊——因为敏感性较低。对于被感染h1,一种检验的阳性可以提高被感染的条件概率——作为另一种检验的先验概率,再使用另一种检验,如果也是阳性,则后验概率就更大。另一方面,某个被感染者被一种检验漏报后,另一种检验还可能查出来。

    从上面分析可以看出敏感性的重要性。但是要注意, 敏感性高, 并不意味着阳性e1可信, 而是意味着阴性e0可信,即预测没感染可信。类似地,特异性高并不意味阴性e0可信, 而是意味着阳性e1可信。

    本人研究归纳确证问题(参看:http://www.survivor99.com/lcg/CM/Recent.html), 得到确证度或可信度(在-1和1之间变化):

    qzd2.jpg

    比如, 对于新冠病毒检验,

        b1*=(5-1)/5=0.8;

        LR- =P(e0|h0)/P(e0|h1)=特异性/(1-敏感性)=0.9/0.5=1.8;

        b0*=(1.8-1)/1.8=0.44<b1*

说明, 作为检验手段,阴性远不如阳性可信。注意:b*和基础概率P(h1)无关,只和检验手段有关, 所以被称之为信道确证度。

    通过P(h1)和b1*也可以算出被感染的概率:

        P(h1|e1)= P(h1)/[1-b1*P(h0)]。

同理有

        P(h0|e0)= P(h0)/[1-b0*P(h1)]。

但是, 这一确证测度——信道确证度——和似然比一样, 只反映信道或检验手段好坏, 并不反映概率预测好坏。 为此我们还需要预测确证度c*:

qzd-c.jpg

c*在预测的概率大于0.5时大于0, 否则小于0.

        比如对于新病毒检验,

c1*=(0.56-0.44)/0.56=0.12/0.56=0.21.

c0*=(0.878-0.122)/0.878=0.86.

比较b*和c*可见,对于概率预测,阴性比阳新更加可信——因为预测的没被感染的概率更大。 通过c*能更方便算出被感染的概率:

    P(h1|e1)=1/(2-c1*);

    P(h0|e0)=1/(2-c0*).

对于上面新冠病毒检验,通过阳性可以预测被感染的概率:P(h1|e1)=1/(2-0.21)=1/1.79=0.56。

通过阴性可以预测没被感染的概率:P(h0|e0)=1/(2-0.86)=1/1.14=0.878.

上面结果和用b*算出的结果相同。但是在基础概率P(h1)改变的情况下,要计算被感染的概率还是用使用b*, 即用公式P(h1|e1)= P(h1)/[1-b1*P(h0)].

总结:假设敏感性是0.5, 特异性是0.9,被感染的基础概率是0.2;

则作为检验手段,阳性的可信度是0.8,阴性的可信度是0.44;

作为概率预测,阳性的可信度是0.21, 阴性的可信度是0.86.

检验为阳性时,被感染的概率是0.56;检验为阴性时,被感染的概率是0.122.

另外, 通过c*,还可以很好解释乌鸦悖论。 详见信道确证和预测确证——从医学检验到乌鸦悖论  

   笔者个人主页中相关讨论见http://www.survivor99.com/lcg/CM/Recent.html 



最新消息:中国疾病预防中心病毒病预防控制所成功研制新型冠状病毒(2019-nCoV)核酸等温扩增快速检测试剂盒, 见http://www.gov.cn/xinwen/2020-01/31/content_5473278.htm  其敏感性和特异性都是1. 预祝检验成功!

 

 

 

 

 

 

 

 

 



http://blog.sciencenet.cn/blog-2056-1218027.html

上一篇:新肺炎疫情2月9日走势,死亡率估计和简评
下一篇:新肺炎疫情到2月12日24时走势,死亡率估计和简评——虚惊一场

1 范振英

该博文允许注册用户评论 请点击登录 评论 (4 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-10-22 12:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部