||
新冠病毒肺炎疫情预测模型说明
(2020年2月2日)
在2月1日,我建立一个非线性动力学模型对二月疫情进行了预测。
“新冠病毒肺炎疫情二月发展预测”:http://blog.sciencenet.cn/blog-3008081-1216565.html
现在对模型进行具体的说明。设X为已感染新型冠状病毒但没有被确诊的人数,他们是潜在的传染源。设Y为累计确诊病例人数,这些人在医院得到隔离治疗。
以1月10日为起点进行模拟,X的初始值处理为参数Xi,Y的初始值为41。在1月10日至15日期间,没有新增病例,肺炎疫情的发展采用以下动力学公式描述:
[dX/dt]=aX (1)
[dY/dt]=0 (2)
其中t为时间,a为传染系数(从平均意义上表示1个传染源在1天内导致病毒感染的人数)。
1月16开始有新增病例,病毒检测效率逐渐提高,肺炎疫情的发展采用以下动力学公式描述:
[dX/dt]=aX-[dY/dt] (3)
[dY/dt]=c[1-exp(-(Y-Y0)/d)] Xt-τ , Xt-τ>0 (4)
其中c表示发病率,d为反映病毒检测效率的因子,τ为平均潜伏期(取6天)。Y0是确证病例基数。1月10日至15日期间确诊病例维持在41人,据此在模型中取Y0=40。随着确诊人数的增多,病毒检测能力逐渐加强,漏检感染者的比例减少。d越小,病毒检测的效率越高。
从1月23开始,全国各省依次启动重大突发公共卫生事件一级响应,隔离防护措施逐渐加强,肺炎疫情的发展采用以下动力学公式描述:
[dX/dt]=aexp(-(Y-Y0)/b)X-[dY/dt] (5)
[dY/dt]=c[1-exp(-(Y-Y0)/d)] Xt-τ , Xt-τ>0 (6)
其中参数b反映传染能力的衰减作用。随着确诊人数的增多,隔离防护的措施越来越严格,病毒传染能力下降。b越小,隔离防护效果越好。
上述模型涉及Xi、a、b、 c、d一共5个参数,可利用1月16日至1月31日的Y值数据进行反演识别。模拟计算时采用Dt=1 day的差分公式处理微分方程,计算X、Y值后四舍五入取整数。以误差平方和为目标函数,该值越小,表示模拟值越接近实际值。也可以用决定性系数(确定性系数R2)来表示,R2约接近1,表示模拟效果越好。
达到最佳拟合效果的参数组合是:Xi=470、aDt=0.229、b=8324、cDt=0.232、d=219。这说明在1月10日可能有接近500人已经感染新型冠状病毒。a值表明在没有隔离的情况下1个感染者可能每4天就传染一个人。c值表明潜伏期6天内病毒感染者的发病率只有23%左右。考虑到参数较多,存在“异参同效”作用,采用GLUE(General Likelihood Uncertainty Estimation)方法进行不确定分析,给出了75%置信区间的预测上限和下限。
所有的模拟预测结果都是在简化假设前提下做出的,只有参考价值。实际的疫情发展涉及很多因素,可能会出现远比模型假设条件复杂的情况。
根据疾控中心最新发布数据,2月1日全国新增确诊2591例,累计确诊14410例。与正常预测曲线相比,2月1日的新增确诊人数明显偏多,有向预测上限靠拢的趋势,如下图所示。我估计这是模型未考虑的其他因素导致的数据振荡,类似的振荡在1月27日也发生过。2月2日的新增病例数有可能下落到靠近正常模拟曲线的位置。如果1月31日发布的数据存在偏小振荡,则意味着实际情况的发展很可能介于模拟曲线与预测上限之间。总体而言,疫情向预测下限发展的可能性越来越小了。
图1 补充2月1日发布数据的新增确诊病例变化曲线(预测上、下限为75%置信区间)
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 12:22
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社