|
编译:小白同学,编辑:小菌菌、江舜尧。
原创微文,欢迎转发转载。
导读 宏基因组学可以揭示食品、肠道等不同环境中微生物组的遗传信息,可用于分析食源性有害物质的传播,如抗生素耐药性(AMR)等。本研究中认为粪便中抗生素抗性基因的相对丰度可能与特定的宿主有关,并且可用于分析耐药性来源。对收集于欧洲各地的猪、肉鸡、火鸡、牛以及长期接触牲畜的工人的粪便样本进行基因测序、用随机森林方法对抗性基因进行分类后发现,各个国家间抗生素抗性基因分布有所不同,且评估了这对人群的影响。通过对AMR进行相似性分析发现,随着宿主异质性的增大,将耐药性正确分类到特定宿主需要更多抗性基因的信息,且不同国家间抗性基因组特征对分类预测的影响也有差异。与饲养肉鸡的工人相比,饲养猪的工人更易暴露于AMR。此外,养猪场的AMR暴露量高于宰猪场。相比于肉鸡和火鸡,人类粪便中的抗性组与猪和牛更为相似,这些差异主要受少量抗性基因的影响。本文鉴定了每个动物宿主的耐药性特征,其中包括与养殖场所使用抗生素相关的抗性基因。通过将人类粪便中的耐药基因追溯回不同动物宿主,发现猪是人类AMR的潜在来源,也进一步表明宏基因组学能够应用于AMR溯源。 论文ID 原名:Metagenomics-Based Approach to Source-Attribution of Antimicrobial Resistance Determinants – Identification of Reservoir Resistome Signatures 译名:基于宏基因组溯源耐药性-识别抗性基因组特征 期刊:Frontiers in Microbiology IF:4.235 发表时间:2021.1 通讯作者:Damian J. Hernandez 通讯作者单位:丹麦科技大学 实验设计
在9个欧洲国家(A-I)的生猪和肉鸡各养殖场分别收集25份新鲜粪便样本进行混合,在其中的3个国家对火鸡和肉牛养殖场进行了采样(图1),并采集了饲养员的粪便样本:肉鸡饲养员(n = 24)、养猪场工人(n = 54)和宰猪场工人(n = 70)。提取粪便样本DNA后用鸟枪法进行双端测序,经过质控的序列与ResFinder数据库进行比对,得到样本中抗性组的信息(389个抗性基因)。用随进森林(RF)方法对抗性基因组进行分类,并用分层随机森林将每一个观测就宿主和国家进行分类,训练内部节点分类器。在R语言中进行数据分析:用HieRanFor包进行分层随机森林的分析,用caret v.6.0–84做随机森林,共构建了五个随机森林模型。其中70%的数据用作训练集,30%的数据作为测试集。通过移除单个基因看模型准确性降低了多少来评估每个抗性基因对于分类的重要性。利用相似性分析来辨别对宿主溯源具有指示作用的抗性基因,明确各基因对于宿主间差异的平均贡献度。基于欧氏距离对抗性基因进行聚类,得到了主要特征基因的相对丰度,并分析了造成人与所接触的动物宿主之间抗性组差异的主要抗性基因。
图1 分层随机森林模型(HRF1 HRF2)中的父节点(国家A-I)和子节点(国家内的动物宿主:Bro =肉鸡,Pig =猪,Vea =小牛肉犊牛,Tur =火鸡)。
结果
用分层随机森林模型(HRF)确定了能够将抗性组精准分类到宿主(而不受采样地点影响)的抗性基因子集,发现若宿主样本间异质性越大,则抗性组就国家进行分类所需的抗性基因数目就越多。来自HRF1(共用389个抗性基因)用于构建HRF2的抗性基因子集(119个抗性基因)有较多与国家无关的抗性特征。与HRF1(平均精度0.833)相比,HRF2模型的整体精度较低(平均精度0.826),但在国家内部宿主分类方面,HRF2与HRF1中的OOB误差相似,在大多数国家都是如此(图2A)。在HRF2中,G和H国家的OOB误差较高,而A、B和E国家的OOB误差较低。国家A、C、F、G、I的肉鸡样本和国家A、D、E、F、G、H、I的猪样本分类准确率有所提高(图2B)。总的来说,HRF2与HRF1性能相似,但HRF2有利于实现在国家间的分类比较。
图2 分层随机森林模型HRF1和HRF2的性能,(A)父节点(各个国家)的OOB误差,(B)子节点(动物宿主)的准确度。
用模型RF1、RF2和RF3追溯人类抗性基因的来源宿主,RF1专门针对这四种动物抗性基因数据进行训练,RF2的训练数据包括人类和动物抗性组(图3)。RF1和RF2都是根据先前在HRF2中使用的(一组独立于国家的)AMR子集进行训练的,准确度相似,包括了来自所有国家的数据。RF1表明人样本中抗性基因源自于猪的得分较高,与其它三种动物相比,人类和猪具有更为相似的抗性组。RF2进一步表明,一旦模型包含了人类样本,抗性则主要归因于人,其次是猪。RF3为F国模型,所用数据为F国人和动物的样本,比RF2准确性更高。图4比较了三组人中RF2和RF3得分分布情况:肉鸡养殖场的工人中,RF3比RF2所得人的得分比例增加而猪的比例减少。因此与接触肉鸡的人相比,接触猪的人抗性组中会有更高比例源于猪,RF2和RF3都显示了养猪场工人比宰猪场工人有更高比例的抗性组源于猪。
图3 用随机森林模型分析了人粪便样本中抗性组的来源,横轴表示149个人粪便样本,纵轴为其抗性组来源占比,“人类”分类代表除4种家畜外的其他来源。
图4 模型RF2和RF3将人粪便样本中抗性基因溯源到各个宿主的得分占比情况,“人类”分类代表除4种家畜外的其他来源。
四种食用动物中,肉鸡-牛和肉鸡-猪之间的耐药性差异最大(分别为72.4%和72.2%),猪和牛的抗性成分相近(38.9%)。肉鸡和火鸡与人类抗性组之间差异最大(分别为86.7和83.8%),牛和猪与人差异分别为61.6和61.8%。通过一对一宿主比较在主要耐药性中识别出19个独特的高丰度抗性基因(图5),其中一些基因并不仅仅属于单一宿主。aph(3’)-II、aph(3’)-IIIa和sul2为牛的特征抗性基因,tet(A)、tet(L)和tet(S/M)为火鸡的特征抗性基因,ant(6)-Ia、lnu(A)、cfxA6分别为猪、肉鸡和人的特征抗性基因。此外,erm(F)、mef(A)、tet(40)和tet(Q)主要在牛中,其次在猪中被鉴定为特征抗性基因,而blatt -126和erm(B)主要在肉鸡或火鸡中被鉴定为特征抗性基因。考虑19个主要抗性基因,图6显示了各类AMR(四环素、大环内酯、β-内酰胺、氨基糖苷类和磺胺类)对成对宿主间差异的贡献。
图5 造成成对宿主间差异的19个主要抗性基因,点的颜色代表两两比较中具有较高相对丰度的样本。
图6 各类AMR(四环素、大环内酯、β-内酰胺、氨基糖苷类和磺胺类)对成对宿主间差异的贡献率。
人与动物间差异分析显示,猪和养猪人间抗性组差异比猪和非养猪人之间差异低8%到12%。相反,肉鸡和养鸡人的抗药性差异(87%)与肉鸡和非养鸡人抗药性差异之间几乎没有差别。通过与三组工人样本间的成对比较,识别出16个特征抗性基因(图7)。ant(6)-Ia、mef(A)和tet(40)被鉴定为猪的特征抗性基因,blaTEM-126、lnu(A)和erm(B)被鉴定为肉鸡的特征抗性基因,cfxA2、cfxA6和tet(Q)被鉴定为人的特征抗性基因。动物抗性组中的lnu(C)、tet(O/W)和tet(W/32/O)总是多于人的抗性组,图8显示了基于这16个抗性基因相对丰度对样本的层次聚类。总的来说,人、猪和肉鸡的抗性组有明显的区别,三种工人聚类在一起,与猪的抗性组较为接近。有个别的人粪便样本与“猪群”重叠,这种样本多来自养猪场工人。为了评估单个抗性基因丰度对差异贡献的重要性,需要进行多元回归分析,还可以通过判别分析进一步明确宿主特征的显著性。
图7 造成工人和其饲养的猪、肉鸡的抗性组之间主要差异的抗性基因,点的颜色代表两两比较中具有较高相对丰度的样本。
图8 基于主要差异基因相对丰度的热图,聚类关系可以表示三组工人与猪和肉鸡的抗性组之间的差异。
讨论
有监督的分类算法已越来越多地应用于追溯复杂样本中特定微生物污染或抗生素抗性基因的上游来源,随机森林方法可以作为算法的参考基准。在本研究中运用了分层随机森林溯源AMR宿主。将分类算法应用于宏基因组等高维数据的主要挑战是识别特征变量,从而为预测提供较强的分辨能力,尤其在这些特征变量不属于同一类别时。随机森林方法对各个特征的重要性进行排名,用来指导特征的选择。在本研究中,特征选择的第一步是基于各抗性基因在分层随机森林模型中的重要性,这个模型在训练过程中根据国别对样本进行分离。特征选择方法本身会影响模型的分类精度,因此还需要评估其他特征选择的方法来进行优化。将国别作为一个分层能够减少后续特征变量的数目且能识别某抗性基因是否与特定国家相关,有利于抗性组的溯源。评估首个分层随机森林模型的性能时发现,随着样本间宿主异质性的增大,对抗性组进行分类所需的抗性基因也增多。虽然35个抗性基因可以在5个国家中同时用于耐药性溯源,但这里选择了19个基因,仅在两个国家中区分猪、肉鸡、火鸡和牛之间抗性组的差异。在第二个分层随机森林模型中,特征变量的减少并没有改善模型的整体性能,但对于A、E和I国抗性组的分类能力有所提高。相反,在G、D和F国家,模型的分类准确性则有所下降,可能对这些国家的分类预测情况受到特征抗性基因的影响较大。该模型在对肉鸡和火鸡的抗性组分类方面有所改进,而对猪和牛的分类预测准确性则下降了。
在不同假设下建立了3个随机森林(RF)模型,并对其预测效果进行评价。RF1只用动物抗性组数据进行训练,难以充分地对人体中抗性组进行溯源,需要考虑其他来源来进行分析。该模型的预测结果与RF2有一致性,即二者均表明在这四种家畜中,猪的抗性组成与人最为接近。RF3对特定国家利用其特征抗性基因进行分析,准确性略有提高且养鸡人的抗性组中被归为猪的得分比例有所下降,另外也说明养猪人比养鸡人的抗性基因暴露量更高。尽管两模型有所不同,但都表明,养猪场工人比宰猪场工人的抗性组更多地归为猪源。此外,RF3说明需要选择该国宿主中合适的抗性基因以提高分类准确性并得到关于特定传播链的有力证据。然而,并非每个国家都是如此。例如,当特征变量缩减为一组与国家无关的抗性基因时,A、E和I国家的预测性能有所提高。而对F国准确分类却更难了,这可能是由于这组与国家无关的抗性基因集不包括造成F国内宿主差异的重要抗性特征。
宿主间差异分析的结果表明,人类抗性组成更接近猪和牛,而非肉鸡和火鸡。令人惊讶的是,这两种鸡抗性间的差异比猪和牛之间的差异还要大,具体原因有待对抗生素使用及微生物组差异方面的进一步研究。在同一国家中,肉鸡和火鸡中分离出的乳酸菌对抗生素的敏感性存在差异:二者对四环素、林可霉素和恩诺沙星的耐药性都较强,而分离于肉鸡的菌株对噻穆林的耐药性更强,比分离于火鸡的菌株更具多重耐药性。二者都有较多的erm(B)基因,而lnu(A)在分离于肉鸡的菌株中丰度更高。本研究中,两宿主间,一半以上的抗性差异都可以用10个抗性基因的一组特征来解释。在这些造成差异的主要基因中,进一步确定了各个宿主的抗性特征,这些特征与取样的国家无关(基于389个抗性基因)。通过评估接触者(养猪场、宰猪场或肉鸡养殖场的工作人员)与肉鸡和猪耐药性的相似性发现,猪和养猪场工人的抗性组差异低于与其他两组人之间的差异,而肉鸡抗性组分别与三组人的三个差异较为相似。这表明农场中抗性基因在工人和猪之间发生了传播,基于抗性基因相对丰度的样本聚类关系也能够说明这一点,因为养猪人的样本偶尔会与猪的样本有所交错。本研究中识别的猪和肉鸡的特征耐药性包括以前也被鉴定为这些物种“核心抗性”的抗性基因(使用同一组样本)。本研究中识别的猪特征抗性:ant(6)-Ia)、erm(F)、mef(A)、tet(40)及tet(Q)基因,以前也被鉴定为肉鸡和猪的核心抗性的一部分。相比于之前的研究,抗性基因和宿主间关联的这种差异或许是由于本研究中又加入了牛和火鸡进行比较所致。
有研究将猪和肉鸡的抗性组与抗生素的使用情况进行关联,发现大环内酯、四环素类抗生素与erm(F)、tet(40)或mef(A)基因的相对丰度之间存在显著的正相关关系,本研究中这三种抗性基因被识别为猪的主要特征抗性基因。肉鸡养殖场使用的大环内酯或β-内酰胺类抗生素与erm(B)或blaTEM基因的相对丰度之间存在显著正相关关系,本研究中这两种抗性基因被识别为肉鸡的主要特征抗性基因。持续使用某种抗生素会导致特定的抗性在农场、国家、甚至在宿主物种水平上的积累,最终可能将这种抗生素抗性从动物传播到人类体内。本研究中抗性基因cfxA2和cfxA6被鉴定为人类的特征耐药性,已经在拟杆菌等口腔厌氧菌中被发现。另一项研究也发现,同一国家中与接触肉鸡的工人和对照受试者(不接触牲畜)相比,饲养猪的工人含有丰度更高的抗性基因,该研究还明确了不同职业群体之间和其内部抗性组成的显著差异。在农场工作的时间和饲养动物的不同(猪与鸡)也与工人粪便中抗性基因的丰度有关,表明工人的这些抗性基因可能是由于接触牲畜而获得的。此外,通过比较养猪人与对照受试者的抗性组之间丰度的差异发现,30个抗性基因的丰度存在显著差异,包括mef(A)、tet(Q)、erm(F)和tet(40)丰度的增加,这些基因主要来源于猪。
结论
本研究利用宏基因组学数据将人类粪便中抗生素抗性溯源到不同的牲畜宿主:用随机森林算法来识别具有国家或宿主特异性的特征抗性基因,可以有针对性地来进行溯源研究。需要根据具体情况来对特定国家的模型进行评估,因为各国宿主动物的抗性组之间可能存在较大的异质性。在其中一个国家的模型中,发现养猪人粪便中的抗性基因主要与猪的抗性组具有关联性。对此发现的具体解释还需仔细斟酌,因为肠道中的抗性组也可能会受到肠道微生物组成的影响,且本研究的这几种动物宿主中,猪的肠道微生物组可能与人类最为接近。人类和动物宿主微生物组的相似性、不同宿主的微生物组和耐药性之间的关系还有待进一步研究。此外,本研究的一些局限性也有待完善:需要扩大人群的采样范围而非仅局限在一个国家,需要增加不接触牲畜的对照被试,需要收集各个国家的多种家畜粪便样本进行分析,还需要平衡各组采样量。尽管尚有不足之处,本研究为宏基因组在耐药性溯源方面的应用奠定了基础,从而为耐药性传播的评估提供了一种基于抗性组的有效方法。
你可能还喜欢
微生态科研学术群期待与您交流更多微生态科研问题
(联系微生态老师即可申请入群)。
了解更多菌群知识,请关注“微生态”。
点击阅读原文,免费下载该SCI原文
不看此公众号
微信扫一扫
关注该公众号
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 04:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社