雪国分享 http://blog.sciencenet.cn/u/cstfzhao

博文

记录我的第一篇论文:基于隔离和信息投递的传染病控制策略 精选

已有 1574 次阅读 2020-3-27 06:32 |个人分类:在大连的时光|系统分类:科研笔记

2016年,我发表了第一篇论文。这篇文章融入了一些妙思,是我硕士阶段最喜欢的一个工作。可惜发表之后一直无人问津,甚至比后来的文章还要表现得差一点。最近一个月,Research Gate提醒我这篇文章多了不少阅读。终于对别人有一点参考价值了,很高兴,是时候记录一下心路历程了。

【以贴近现实为出发点】

这是我当时写的第二篇文章。第一篇光审稿就用了两年,中间还绞尽脑汁地、委婉地催了两次。有了这个教训,第二篇投稿时选择了审稿周期短、口碑还不差的Physica A。

我在这个领域刚入门时,能感觉到复杂网络中的传播控制是国内比较小众的方向。常见的做法是改造一些传染病仓室模型,如SIR、SIS等,然后在人工生成的复杂网络(如无标度、小世界、静态真实网络等)中进行传播模拟,通过理论推导求得疾病的稳态条件。或者提出一些免疫控制策略,通过模拟传播来证明有效。

我按这个模式仿真了一遍后,觉得和实际有那么一点脱钩。主要问题出在网络设定上:现实中的网络节点就是人,人每天都在不停的移动当中,和其他人发生接触后才会受到感染。而最接近这个模式的是人群接触网络,但可惜现有网络大多是静态的、或者非常小范围的动态接触网络。比如,基于传感器捕捉到的小型展览会中的接触网络、中小学生校内接触网络等。

为了贴合实际,我开始搜集真实的人群移动数据集。最终在SNAP的数据中心找到了两个公开的基于地理位置移动的数据集:loc-Brightkite和loc-Gowalla(下载地址见文末)。Gowalla和Brightkite是两个基于位置定位的社交网站,人们使用平台时自愿共享位置信息,因此不存在隐私侵犯问题。

这个数据集的贡献者做了一个挺有意思的研究——总结人类活动的一般规律。他们根据人们登录打卡的地理位置变动、以及用户在网站中的好友关系,推测用户为什么发生地理位置变动。结论大概是:周一到周五是规律性移动(上班),周六日可能会在周边几十公里移动(汽车能行驶到的城市范围),而超长移动和访问当地朋友关联很大。看似很直观、很符合常理几个结论,但是能够推导出这些结论并得出具体规律,是建立在非常细致的前期观察和量化分析的基础上。

我选择了其中规模相对较小的loc-Brightkite作为实验场景。这个社交网络中,有的用户会在一天之内打卡多次。于是我把一天之中的登陆数据按经纬度取平均值,作为该用户当天所在位置。然后借鉴了原始论文的结论,以用户的当前位置为中心,r为半径画圆,将这个用户的联络者从地理位置上划分为四种类型:

①密切接触者(r<25km ):用户日常经常接触的人,例如同事、邻居等。
②可能接触者(25km<r<100km):用户很有可能在一周内接触一次的人,例如同城或者邻城的朋友。
③潜在接触者(100km<r<1000km):用户有较小可能在一段时间内接触一次的人,例如同省或者邻省的朋友。
④远程联络者(r>1000km):用户几乎不大可能有肢体接触的人。

四种类型的接触者,随着当前用户位置的移动,会发生动态转化。

这样等于站在了前人靠谱研究的基础上,可以开展模拟疾病传播和控制了。有了这个这个真实的移动网络,疾病的模拟也不能太抽象了。我借鉴了“人类活动规律”这篇文章的研究方法,统计了几个常见突发传染病的潜伏期,比如霍乱、疟疾、埃博拉、SARS、MERS等,最后求得一个平均的发病周期——大概为7天左右。

基于这个结果,我以7天为周期进行疾病的传播。下图是自由传播3个月后,疾病的分布情况。可以看出,传染病随着真实的人群移动数据,从一个点散播到了世界各地(果然是全球化的时代):

image.png

【融入日常观察】

有了传播模型,我又想出一个结合隔离和信息传播的控制策略。物理世界中,隔离被感染节点是有效防疫措施。但是在精神世界,引起人们的重视才是保护未感染群体的有效措施,特别是那些处于感染边缘地带的人们。

问题是,除了公共广播,如何才能够真正引起人们重视呢?

2016年的知乎、短视频、公众号好像还没有现在这么火热。我当时想的办法是:“让感染后发病后被隔离的人,通过社交账号或者个人联系方式,向周围人发送防疫信息,提醒他们注意自身状况和安全。隔离者的邻居将收到第一手的信息,重视程度最高。隔离者的邻居的邻居将受到第二手的信息,重视程度减弱。这里假设三手、四手的信息的效果和大众广播的效用相当,因此只考虑一手、二手信息的传播。”

这个“隔离和信息防疫”的原始思路的原理很简单:只有与自己非常相关、或者容易联想到自身的新闻报道,才最能唤起人们的关注和重视。存在于遥远国度的战乱即使再严峻,民众也会感觉自己很安全,由此放松警惕。突发传染病中,在没有有力的社会动员、社会宣传的情况下,这是一种迅速提醒“潜在感染群体”的有效策略。

此外,还考虑到信息传播质量对人们重视程度的影响。举个例子,当有人发消息说“某某人被隔离了,你要多加注意”。你很想注意,但可能找不到有效的方法。如果消息的内容是:“我于X月X日被隔离了。你要注意在家隔离观察、发低烧立刻求助医院、出门戴口罩和护目镜、回来多洗手和消毒、自身免疫力是最有效的药物等等”,你大概率会清楚如何才能有效保护自己、保护他人。

传播模型、控制策略都有了,我就按“周”为单位画了个传播和控制效果的模拟图。画完后也没有做对比实验和参数分析的实验,就直接投出去了。下图分别为:感染源(红色为感染)、开始控制(蓝色表示隔离)、完全控制住后的情形。

image.png

做完实验后我感觉结果有点夸张。当时了解的SARS、MERS、Ebola都只是局部地区传染病,很少见到短时间内传遍全世界的。现在看来,还是自己经历不够:短短几年时间,交通和病毒已经发展进化得这么厉害了。

这篇文章的审稿人可能是个欧洲的学者,比较认真和包容,没有直接否定我简陋的公式和实验,而是耐心告诉我该怎么做才规范:“我们通常会先在模拟的环境中测试一遍,考察模型参数的敏感性”。原话如下:

You do not show the results of the sensitivity analysis. Neither sensitivity to the numerical values of the parameter, nor to the assumed scenarios of the mechanisms. Authors picked up and studied one selected scenario of the mechanisms of infection. Depending on the disease type and assumptions we can have a vast number of such a scenarios. It is worthy to show the behaviour of the system when considering other scenarios of the infection mechanism.

还列出一系列很细节的论证,最后给了一个大修。在我加了一整个章节的实验后,尽管收到的评语为“我注意到至少10处语法错误,很可能有更多”,但审稿人还是认可了修改后的工作。这个小课题也基本告一段落。

【后记】

我硕导擅长的研究方向是混沌密码学、图像加密算法等,复杂网络是他顺着混沌系统的研究开辟的新方向。我们那一届的同学中,四个有三个自愿当了“小白鼠”:一个复杂网络传播的小白鼠、一个网络社团划分的小白鼠、一个网络级联故障的小白鼠。

硕导在选方向时候告诉我们:“你们可以做自己感兴趣的课题。如果你们选了我们课题组之前有积累的,就会有工作基础和经验。如果选择新方向,从头做起来就会吃力点,但也能做出不错的成果,比如某某前辈。不论怎么样,你不是一个人,背后有我们整个团队做支撑。”我一直记得这番话,并且深深感谢他的支持。虽然摸索的过程中存在很多不规范的地方,但培养了相对自主的思考习惯。后来家庭原因,我来到广州读博,在华工得到了更为系统和严格的科研训练,也在博导的支持下尝试着新的拓展和突破。合适的时机遇见合适的导师,大概是我过去和现在的幸运之处。

英文版文章:Model of epidemic control based on quarantine and message delivery.pdf
中文版在我的硕士论文第3章:复杂网络的信息传播动力学及控制策略研究
数据集:http://snap.stanford.edu/data/index.html#locnet



http://blog.sciencenet.cn/blog-3421868-1225471.html

上一篇:每一个走心的审稿意见都是对文章的贡献:一篇巨无霸论文的诞生

3 赵大伟 熊建华 黄永义

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-4-4 18:05

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部