spring63的个人博客分享 http://blog.sciencenet.cn/u/spring63

博文

《自然》:改进冠状病毒检测的数学策略

已有 6765 次阅读 2020-7-13 09:32 |系统分类:海外观察

2020年7月10日,《Nature(自然)》杂志网站刊载了题为<改变冠状病毒检测的数学策略>的文章(参考资料[1])。作者斯姆里蒂•马拉皮蒂(Smriti Mallapaty)用四个图显示了将从多个人的采集的样本,集中在一起测试,可以节省时间或资源。下面介绍马拉皮蒂的文章。

科学家们说,需要进行广泛的检测以控制新冠病毒的爆发。但是,在许多地区,测试所需的化学物资短缺。在一些国家,卫生官员已经开始使用第二次世界大战时首次提出的策略:集体测试。研究人员说,通过同时测试许多人的样本,可以节省时间、化学试剂和金钱。

海法以色列理工学院系统生物学家罗伊·基肖尼(Roy Kishony)说:“在目前的疫情中,有必要对大量人群进行检测,这使得合并测试成为一个有吸引力的选择。”。

中国、印度、德国和美国已经在使用群组测试。

进行集体测试可以有多种方法。一些国家的科学家正在试验最佳的测试方法。其想法主要源于被称为群组测试 (Group testing) 问题的数学领域。群组测试已经被广泛应用——从检测有缺陷的圣诞树灯,到估计人群中艾滋病毒的流行率。罗利北卡罗莱纳州立大学的信息科学家卓尔•巴伦(Dror Baron说:“该领域有一系列的创新”。

《自然》杂志重点介绍了目前正在试用的四种方法。

【方法1 (多夫曼)】

最简单的集体测试策略是经济学家罗伯特·多夫曼(robert dorfman)在20世纪40年代提出的用于对士兵进行梅毒检测的策略。

在这种方法中,相同数量的样本(在SARS-CoV-2冠状病毒的情况下,从鼻拭子和咽喉拭子中采集的样本)混合在一起,进行一次测试,排除了测试结果为阴性的样本组。但如果某一组测试呈阳性,则该组中的每个样本都将单独重新进行测试。研究人员根据病毒在社区中的流行程度,来估计最有效的群组的规模。

                                              image.png

方法1:将样品按等大小分组混合在一起进行测试。如果一组测试呈阳性,则每个样本单独重新测试

今年5月,中国武汉市的官员利用这一方法,对武汉市绝大多数人口进行了检测,在短短两周多的时间里,大约检测了1000万人。对来自约230万人的样本,进行了分组测试,一组最多有5个样本,共鉴定出56名感染者。

研究人员说,当感染水平较低时(人群中1%左右),这种方法是最有效的,因为集体测试更有可能是阴性的,这节省了对许多人的单独测试。

【方法2 (多轮的组测试)】

一个更复杂的版本是在分别测试单个人样本之前,添加更多轮的组测试。增加了轮次,减少了需要单独测试的人数。

image.png

方法2:在方法1中增加了额外的分组测试,减少了测试需求的数量

但是,这种方法很慢,因为每次小组测试都需要几个小时才能得出结果。卢旺达基加利非洲数学科学研究所的理论生物学家威尔弗雷德·恩迪丰(Wilfred Ndifon)说:“这是一种生长迅速、传播迅速的疾病。我们需要的答案比这种方法所允许的要快得多。”

【方法3(多维)】

弗雷德·恩迪丰和他的同事改进了罗伯特·多夫曼的策略,他们计划在卢旺达进行试验,从而最终减少了所需的测试数量。他们的第一轮小组测试和多夫曼的一样,但是对于测试阳性的群体,他们建议第二轮将样本分成重叠的组。

想象一个有9个单元的正方形矩阵,每个单元代表从一个人身上取的拭子样本。每行样本作为一组进行测试,每列样本作为一组进行测试,共测试6次,每个人的样本分在两组中。如果样本中含有SARS-CoV-2病毒RNA,两组测试结果都是阳性的,这就很容易确定患者的身份。研究人员在4月30日发布在arXiv服务器上的预印本(v1提交日期:2020年4月30日,本版本v2最新修订日期:2020年5月18日)中描述了这个想法(参考资料[2])。

image.png

方法3:采用两轮试验。在第二轮测试中,样本在多个重叠的组中进行测试,用正方形矩阵上的行和列表示。通过添加维度可以测试更多的人(参见立方体)

英国爱丁堡大学理论物理学家、研究合作者尼尔图洛克(Neil Turok)说,增加维度的数量,例如,从正方形增加到立方体,可以使群体规模更大,效率也更高。

恩迪丰(Ndifon)是卢旺达COVID-19工作组的一员,他说集体测试是政府快速识别和隔离感染者的战略的一部分。他和他的同事估计,他们的方法可以将检测成本从每人9美元降低到75美分。研究人员正在实验室进行实验,看看有多少样本可以实际包括在一组测试中,并且仍然测试出阳性结果。基加利卢旺达大学的遗传学家利昂穆特萨(Leon mutesa)和政府工作组的另一位合作者说,他已经能够在实验室的100个样本中鉴定出一个阳性样本。

德国霍姆堡萨尔兰大学医学中心的分子病毒学家西格伦斯莫拉(Sigrun Smola)一直在对进行多达20个样本的分组测试,他不建议一次测试超过30个样本的分组,以确保足够的准确性。她说,更大的群组将使病毒测试更加困难,并增加漏检阳性的几率。斯莫拉也对立方体切片技术在常规测试中的实际应用持怀疑态度。她说,“如果你把这件事告诉技术人员,他们会说真是一团糟”,她补充说,“我想要一个简单的方案。”

恩迪丰说他的团队计划开发软件来自动放置样本。

【方法4(一步到位)

一些研究人员说,在试图遏制像SARS-CoV-2这样快速传播的病毒时,即使是两轮测试也太多了。孟买印度理工学院计算机科学家马诺伊•戈帕尔克里希南(manojgo palkrishnan)说,实验室技术人员必须等待第一轮测试结果出来,这会减慢检测过程。

戈帕尔克里希南建议在一轮中进行所有的测试,并且有许多重叠的组。这将增加测试的数量,但将节省时间——虽然最初的设置是耗时的,因为有额外的组意味着更多的样本必须被移走。

戈帕尔克里希南的方法包括在不同的组中混合样本,使用一种称为柯克曼三元系(Kirkman triples)的计数技术,该技术为样本的分配设置了规则。想象一个平面矩阵,其中每一行代表一个测试,每一列代表一个人。一般来说,每次测试应包括相同数量的样本,每个人的样本应测试相同的次数。

image.png

方法4:只使用一轮测试。样本分布在重叠组的矩阵中

但是,德克萨斯农工大学(Texas A&M)的信息理论家克里希纳·纳拉亚南(Krishna Narayanan)说,一步式策略需要更多的测试,以确保与多步组测试相同的准确性。他说,一步到位的方法还意味着同时处理大量样本,这可能很棘手。“技术人员不可能做到这一点。你需要一个机器人系统。”

为了简化实验过程,戈帕尔克里希南和他的同事开发了一款智能手机应用程序,告诉用户如何混合样本。他说,在印度孟买、班加罗鲁和泰雷瑟里进行的临床试验未发表的结果中,320个样本中仅用48个测试就成功地鉴定出5个阳性样本。

以色列的研究人员正在使用一个自动化系统和一个应用程序来应用类似的一步式系统。莫兰•斯瓦克沃特-科恩(Moran Szwarcwort-Cohen)是海法兰巴姆卫生保健校区病毒学实验室的负责人,她说,她的团队目前正在评估该系统,并取得了有希望的结果。

以上是参考资料[1]主要内容,比较直观。参考资料[2]则有较多的数学抽象。以考虑只有一个人被感染的情况为例,其算法背后的想法是几何的:在测试之前,将子样本集中在高维超立方体模式中。被测个体的群组由用D维立方格上的N个点集合表示,这些点组织成每边有L个点的超立方体的形式,因此,

L D = N

不是直接测试每个个体的样本,而是首先将其分成D个相等的子样本。将超立方体切片成L个平面切片,垂直于晶格上的主方向。在每个主方向形成这样切片集合。每个切片由N/L=LD-1个点组成,总共有DL切片。对应每个切片,组合L D1子样本。如果只有一个受感染的个体,那么从每个D方向的L切片中有一片会得到阳性结果。沿着相关的主方向,该切片直接指示与感染个体对应的点的坐标。因此,唯一识别感染者所需的试验次数为:

DL=DN1/D

如果病毒流行率低,最佳群体规模N和维度D大,则检测效率高。

image.png

对于D=L=3和N=27,超立方体算法中的样本池。每个格点代表个体。超立方体被分成L片,在每个D主体中来自N/L个体的样本被汇集到每个切片的样本中。在本例中3组切片以蓝色、红色和绿色显示。如果存在有一名感染者,则只需要9个测试可以唯一地识别。

参考资料:

[1] Smriti Mallapaty. The mathematical strategy that could transform coronavirus testing. NATURE. NEWS. 10 July 2020

https://www.nature.com/articles/d41586-020-02053-6

[2] Mutesa, L. et al. A strategy for finding people infected with SARS-CoV-2: optimizing pooled testing at low prevalence. 预印本(可下载)见: https://arxiv.org/abs/2004.14934




https://blog.sciencenet.cn/blog-3005681-1241806.html

上一篇:Robo chemist:化学实验室里的自主机器人
下一篇:神秘的137
收藏 IP: 223.20.74.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 05:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部