||
原文链接:https://academic.oup.com/ismej/article/18/1/wrae049/7636249
AbstractNatural ecosystems harbor a huge reservoir of taxonomically diverse microbes that are important for plant growth and health. The vast diversity of soil microorganisms and their complex interactions make it challenging to pinpoint the main players important for the life support functions microbes can provide to plants, including enhanced tolerance to (a)biotic stress factors. Designing simplified microbial synthetic communities (SynComs) helps reduce this complexity to unravel the molecular and chemical basis and interplay of specific microbiome functions. While SynComs have been successfully employed to dissect microbial interactions or reproduce microbiome-associated phenotypes, the assembly and reconstitution of these communities have often been based on generic abundance patterns or taxonomic identities and co-occurrences but have only rarely been informed by functional traits. Here, we review recent studies on designing functional SynComs to reveal common principles and discuss multidimensional approaches for community design. We propose a strategy for tailoring the design of functional SynComs based on integration of high-throughput experimental assays with microbial strains and computational genomic analyses of their functional capabilities.
摘要
自然生态系统蕴藏着大量分类学上多样化的微生物,这些微生物对植物的生长和健康至关重要。土壤微生物种类繁多,相互作用复杂,因此很难确定微生物为植物提供生命支持功能的主要参与者,包括增强对(非)生物胁迫因素的耐受性。设计简化的微生物合成群落 (SynComs) 有助于降低这种复杂性,从而揭示特定微生物组功能的分子和化学基础及其相互作用。虽然 SynComs 已成功用于剖析微生物相互作用或重现微生物组相关表型,但这些群落的组装和重建通常基于通用丰度模式或分类学身份和共现,而很少由功能性状决定。在这里,我们回顾了最近关于设计功能性 SynComs 的研究,以揭示共同原则并讨论群落设计的多维方法。我们提出了一种基于高通量实验检测与微生物菌株的整合以及其功能能力的计算基因组分析来定制功能性 SynCom 设计的策略。
简介
土壤和植物是大量微生物的家园,这些微生物对各种生态系统服务至关重要,包括污染物降解、生物地球化学循环以及支持植物生长和健康。人们发现,许多迷人的自然现象都有微生物基础,包括植物病害抑制 [1, 2]、植物生长促进 [3, 4] 和植物抗逆性 [5],这促使人们广泛研究微生物、宿主和环境因素之间复杂的相互作用。通过改变土壤微生物群落而产生理想表型的土壤改良剂表明,对微生物生态系统代谢潜力的根本理解可以带来农学效益 [6, 7]。不依赖培养的测序技术的发展和用于分析由此产生的宏组学数据的生物信息学工具的激增,对不同环境中微生物群落的理解产生了深远影响。例如,可以利用在极端环境中发现的独特微生物的潜力来应对气候变化带来的挑战 [8, 9]。此类方法已生成大量数据集,为生成大量假设提供了丰富的资源。不过,仍然必须采用互补的实验方法来严格测试这些假设。事实上,由于需要在受控环境中分离和研究微生物菌株和/或群落(图 1),为应用而(重新)构建微生物群落 [10-12]、识别微生物组相关表型背后的机制和因果关系 [13-16] 以及分析微生物与微生物之间的相互作用 [17, 18] 的努力仍然严重依赖于培养依赖性微生物学、分子生物学和植物生物学方法。虽然解淀粉芽孢杆菌和苏云金芽孢杆菌等单个菌株已在农业生物防治中使用了几十年 [19],但它们赋予特定表型的功效取决于与常驻微生物群及其宿主的复杂相互作用 [20]。因此,设计由优先菌株组成的合成群落 (SynComs) 已成为在受控条件下研究复杂微生物组相关表型的关键技术 [16, 21]。这需要多种策略,要么通过识别必需候选物(自上而下)来简化或解构(退出方法)复杂群落,要么从执行特定功能的单个分离物开始,逐步重建负责特定表型的核心微生物群落(自下而上)[22, 23]。
图 1 设计合成微生物群落以揭示微生物组相关表型的重要性。通常从具有感兴趣表型的宿主开始,分离细菌菌株并使用组学数据和/或表型分析进行表征。基于分类或功能特征,设计具有降低群落复杂性的合成微生物群落,可用于研究所研究表型的机制决定因素。使用 BioRender.com 创建。
设计 SynCom 的核心挑战是选择能够代表所研究微生物组的分类学和/或功能特征的候选物。一种方法是使用分类学概况,例如样本间的高丰度/代表性 [24, 25]、与其他群落成员共现 [26] 或具有对比表型的样本之间的差异丰度 [27]。在过去十年中,人们越来越关注通过(元)基因组挖掘探索微生物的生物合成潜力,作为传统实验室筛选之外的 SynCom 设计的补充方法 [28, 29]。这方面的另一个前沿是采用计算机模拟方法预测代谢相互作用,例如使用基因组规模代谢模型 (GSMM) [30-32]。
在这篇小型评论中,我们将讨论过去和现在几种 SynCom 设计策略的优缺点。我们将重点介绍基于功能特征的 SynCom 设计方法,并提出一种结合计算(元)基因组方法和高通量表型分析优势的新颖概念工作流程。
SynComs 的设计策略
在过去十年中,SynCom 的设计和应用采用了多种原则,用于不同的研究目标。一种常用的方法是基于分类学的设计,它依赖于探索不同自然样本中的微生物组组成并确定核心或代表性微生物组。探索不同地理环境 [33]、宿主基因型 [34] 或采样时间 [35] 中的微生物组组成,可以选择持续存在的微生物分类群(共存组)来模拟核心微生物组的结构和功能。这种方法经常用于模型植物拟南芥 [36] 和特定作物 [37],以及肠道微生物组研究 [38, 39]。最近,全球草地元数据收集的卫星测量与微生物组数据相结合,以识别与植物生产力密切相关的分类群 [24]。这些原则还可通过识别和重建负责生态稳定的微生物群落,用于修复受损的生态系统 [40]。此外,基于分类共现网络,已构建了跨界联合 SynCom,其能够保护番茄免受枯萎病的侵害 [41]。在植物之外的环境中,超过 100 种常见的肠道细菌菌株已被设计成一个合成群落 (hCom1),作为深入探索实验小鼠肠道中因果推断和疾病机制的模型系统 [39]。通过将 SynCom 引入小鼠肠道后反复识别额外的定植分类单元并将这些分类单元添加到群落中,可以创建一个与原始 SynCom (hCom1) 相比更加多样化和稳定的扩展群落 (hCom2)。
这种基于分类学的策略的一种变体已广泛用于设计与特定表型相关的 SynCom,该策略基于比较在具有对比表型的样本中表现出显著丰度差异的微生物分类群。然后可以利用这些比较来指导自下而上的策略,该策略涉及从相对较少数量的具有相关功能属性的单个微生物菌株或物种组建群落,并可能为重建该表型提供良好的起点。例如,Zhuang 等人评估了不同生长阶段、土壤类型和农业实践中的根际微生物组组成,以确定与生长/产量参数相关的分类群,并使用差异丰度分析来选择菌株以构建确实赋予宿主促进生长的表型的合成群落 [42]。在一项分析微生物组介导的细菌性枯萎病抑制的类似研究中,Kwak 等人甚至可以通过差异丰度分析鉴定出单个黄杆菌菌株,该菌株能够在很大程度上重建保护性表型 [43]。除了基于群落水平的表型进行 SynCom 设计外,还可以使用单个分离株的表型来指导微生物群落的重建以进行疾病管理,正如成功构建仅由 7 个菌株组成的抑制香蕉枯萎病的 SynCom 一样 [44]。相比之下,自上而下的方法更侧重于通过干扰来操纵现有的微生物群落,例如群落移植、选择性热处理或抗菌剂,从而改变群落组成和动态。这一原则可以成为研究复杂天然微生物群落功能性状的有益第一步。
除了上述原则外,新型 SynCom 也越来越多地基于自然群落成员的广泛功能(代谢)特征而建立 [18]。代谢相互作用(包括哪些微生物利用环境中的底物或其他群落成员产生的底物以及如何有效利用底物)驱动着整个群落的行为,从而导致各种表型。此类信息已被用来构建一个包含几丁质降解菌和非降解菌分类群的模型联合体,以研究每个分离株的预测和实现的生态位;结果表明,微生物菌株的几丁质降解行为或更普遍的消耗行为在单一培养群落和混合群落之间可能有所不同 [22]。此外,通过分析转录和翻译信息来预测竞争和底物偏好,可以通过添加相应的益生元或益生菌来有针对性地操纵自然群落中特定微生物成员的活性 [45]。基于功能的方法还可以与与宿主表型相关的分类学数据相结合:例如,Carrion 等人确定了在抗病土壤和有益土壤中的甜菜内层微生物群之间始终存在差异丰富的分类群;在特定生物合成基因簇和几丁质酶编码基因表达分析的指导下,他们确定了可以在很大程度上重建抗病表型的小的SynComs [28]。
从以上内容可以看出,SynCom 的设计不再仅仅基于分类学,而是越来越多地涉及选择微生物组成员,这些成员 (i) 在体外或体内表现出正或负相互作用,(ii) 具有特定的功能特征,和/或 (iii) 具有互补/相似的生态位偏好。然而,整合微生物相互作用、功能特征和生态位偏好等标准会带来复杂性,需要全面的实验验证和复杂的分析。尽管存在这些挑战,但这种多方面的方法可以增强 SynCom 的功能,从而实现具有更高弹性的定制 SynCom 设计。
SynCom 设计的生物活性微生物或功能基因的优先级排序
对于基于功能的 SynCom 设计策略,可以考虑各种基因组特征。此类特征的示例(表 1)包括 CAZymes、分泌系统、抗真菌代谢物、金属载体、生物膜形成相关的胞外多糖、植物免疫刺激代谢物、植物激素等。如何在复杂的生态系统中优先考虑功能和微生物成员对于群落重组至关重要。为此目的解释高通量测序技术生成的大量数据可能具有挑战性 [72]。例如,基于共现模式构建的微生物网络在多大程度上代表了给定生态系统时空背景下的实际功能多样性通常不清楚 [73, 74]。微生物组数据集通常只有相对(而非绝对)丰度数据 [75],并且很难定义核心和附属分类群的作用 [76]。采用多维方法,通过整合不同类型的组学和/或实验(元)数据,可以更准确地描述微生物多样性、动态和功能。
2018 年开发了一个采用功能数据进行 SynCom 设计的计算框架,该框架通过自上而下整合宏基因组、代谢组学和表型数据集进行操作,从而能够更可靠地识别假定的机制关联 [77]。相对于以前的方法,该工作流程通过数据标准化、共表达基因和代谢物的分类以及先验(微)生物学知识的吸收实现了降维、过滤错误相关性和数据集成。另一种计算引导的 SynCom 设计方法是通过统计学习可视化群落功能景观,识别微生物与功能性状之间的潜在关联,以更好地了解自然或设计的微生物群落的动态和/或生态背景 [78-81]。基于这些功能景观概念,基于建模的迭代提供了通过基于精心选择的特征的定向进化在计算机上设计复杂的“高功能”群落的可能性[82]。
了解每个群落成员的空间分布和所占据的生态位也是在恢复后保持稳定的群落结构的重要因素。可以采用不同的生态建模方法进行生态位预测,包括洛特卡-沃尔特拉模型、消费者资源模型、基于特征的模型、基于个体的模型以及基因组规模的代谢网络模型 [83]。此外,诸如分析环境相关底物的利用率 [84] 等实验方法可以预测潜在的代谢生态位,可用于推断竞争性或合作性的微生物相互作用。诸如 TbasCO(基于特征的比较组学)[85] 等新工具专注于代谢基因的表达,可以提高捕捉随时间推移的生态位差异特征的准确性。通过辨别不同条件下菌株和物种之间基因组编码功能特征表达的变化,TbasCO 提供了对基因组编码功能潜力在空间和时间上的调控的细致入微的见解。事实上,利用转录和翻译的综合信息来预测竞争比仅根据基因组数据推断具有更高的准确性 [45]。与代谢组学性状相结合的基因组信息也被广泛用于识别与必需代谢物相关的核心基因和联合体 [86]。所有这些策略都有望帮助分析宿主和共生微生物对初级和次级代谢物的利用和产生。具体而言,在选定的环境中对大量可用底物的初级代谢能力与成功的定植和快速的生态位占领密切相关 [87-89]。在讨论对植物病原体和寄生虫等压力源的恢复力时,次级代谢物的活性作用似乎是优先考虑的标准 [90, 91]。
基于性状的 SynCom 设计的计算方法
最近开发了许多创新的计算方法来应对基于大量(元)基因组学数据定制 SynCom 设计的挑战,包括优先考虑最相关的微生物相互作用、识别关键(生态)功能性状以及在计算机中优化功能群落组成。一些基于基因组的工具包括预测微生物次生代谢物生物合成能力的 antiSMASH [92]、用于检测大分子系统的 MacSyFinder [93] 和用于致病性鉴定的 PHI-base [94]。对于次生代谢物生物合成基因簇,预测其生态功能对于 SynCom 设计至关重要。例如,编码金属载体产生的基因簇是抗病土壤中的关键功能决定因素 [95],可以通过识别编码金属离子螯合亚结构生物合成的基因来自动注释 [96]。参与真菌细胞壁和植物衍生聚合物分解的碳水化合物作用酶可以用 dbCAN [97] 等自动化系统进行注释。此外,可以通过与编码已知功能产物的参考生物合成基因簇(例如存储在 MIBiG 数据库中的基因簇)进行比较来识别编码抗真菌剂、抗生素、毒素或生物膜相关胞外多糖生物合成的基因簇 [98]。同样,毒力因子(例如 VFDB [99])或分泌系统(例如 SecReT6 [100])的参考数据库可以帮助识别与致病性相关的功能性状。
基因组规模代谢网络模型 (GSMM/GEM) 在微生物组研究中显著增加,在预测微生物群落内的功能相互作用方面特别有利 [31, 32, 101-103]。此外,随着 GSMM 的兴起,图论方法为微生物群落动态提供了宝贵的见解,特别是在预测生物相互作用和了解营养物质和环境的影响方面 [104, 105]。这些方法被用于确定具有所需代谢潜力的最小物种集 [106],和/或阐明生物体之间的代谢交换 [102, 107]。一项令人兴奋的研究使用 GSMM 来估计数千个栖息地的竞争和合作潜力。结果表明,竞争性群落抵抗物种入侵,但难以应对营养物质的变化,而合作性群落则表现出相反的模式 [108]。已经创建了多种工具来自动重建微生物物种和群落的代谢网络 [109-114]。 MiMiC 是设计功能代表性 SynCom 的最直接工具之一,它利用散弹枪法宏基因组数据进行蛋白质家族注释,旨在用最少的微生物分类群覆盖群落中最多的功能 [115]。与 MiMiC 类似,CoMiDA 不是使用蛋白质家族,而是识别从底物到产物的潜在代谢途径,并旨在找到执行这些过程的最小组合 [106]。然而,成员间生长兼容性、代谢物交换、交叉喂养、代谢性状的差异调节和共培养条件等关键因素仍然需要纳入这些算法中。为了缩小这一差距,FLYCOP 利用 GEM 分配代谢潜力,利用 COMETS(时间和空间上的微生物生态系统计算)[116] 预测微生物相互作用及其动态通量平衡,以通过迭代算法进一步模拟群落动态,并确定多个联合体配置之间的最佳组合 [30]。
用于 SynCom 设计的人工智能
机器学习 (ML) 和人工智能 (AI) 越来越多地用于 SynCom 的 (迭代) 实验优化,因为它们可以帮助导航高维分类单元和功能组合空间。例如,BacterAI 是一种新型自动化科学平台,它允许设计和使用实验平台来生成生长数据作为“奖励”数据集,以进一步优化模型以改进实验设计。无需事先了解,通过对迭代设计进行主动学习,可以有效地生成微生物代谢活性预测 [117]。然而,由于可用数据集大小的限制以及缺乏用于衡量 SynCom 质量的评估标准,使用这些方法定制 SynCom 仍然存在挑战。此外,应谨慎使用 AI 和/或 ML 方法,因为在未经验证的情况下使用它们可能会产生错误或无效的关联。最近的一项研究发现,利用微生物丰度模式可以极其准确地预测肿瘤类型和存在情况 [118],而进一步分析后发现这些相关性是不真实的,从而说明了由于无意中对污染、批次效应或假阳性分类进行训练而产生的风险 [119, 120]。人们进行了一项创新尝试,利用预测微生物成员与宿主表型之间的因果关系,使用深度学习方法开发新型 SynCom [14]。具体而言,他们的方法包括表征生物测定之间的关系(即每种菌株在拟南芥根系分泌物上的生长情况)、根据菌株对植物 Pi 含量的影响对其进行分组来定义功能块、创建部分重叠的 SynCom,以及利用神经网络模型设计新的微生物组合来预测植物中的 Pi 含量。实验验证结果表明,几乎所有这些预测的 Pi 含量确实在植物体内测定中实现了。另一个用于识别关键物种(对稳定的群落结构至关重要的微生物类群)的数据驱动框架采用深度学习,通过进行退出试验来量化每个物种的重要性 [121]。此类试验被广泛用于系统地剔除 SynCom 成员,并检查这种“退出”是否/如何影响微生物组相关表型 [122]。
在人工智能飞速发展的时代,建立群落水平 GEM 有望变得越来越高效和可靠,可以预测微生物之间的代谢相互作用以及它们如何协同利用微生物活动过程中预先存在和产生的底物。结合人工智能驱动的计算设计和实验分析之间的循环,以迭代验证相互作用并改进 SynCom,这些工具生成的关联可以进一步用于定制具有预定义功能的更广泛的 SynCom。与手动设计的 SynCom 相比,这些计算定制的 SynCom 可能表现出卓越的定殖能力和代谢潜力。
影响 SynComs 重建的因素
在微生物群移植策略的背景下,利用不同的工具来构建负责特定(代谢)功能的微生物群落对未来有着巨大的希望。尽管如此,预测的群落成功定殖真实宿主的能力仍是一个谜,直到在湿实验室、温室和田间/宿主实验中进行验证。在从 SynCom 成员的选择和组合到其重建的过渡过程中,面临着无数额外的挑战,包括需要协调微生物之间不同的生长率、确定接种顺序(即优先效应)、每个候选菌株的细胞密度 [123],以及评估可能导致某些 SynCom 成员在此过程中丢失的潜在相互作用。此外,具有不同生长率的菌株的初始浓度变化可能会对组装群落的最终结构和稳定性产生重大影响 [124]。在使用 SynComs 研究相互作用或因果推断时,所有这些变化都有望提高功能随机性。这强调了在重建过程的不同阶段通过低通宏基因组测序、qPCR 数据或荧光标记监测群落组成和结构稳定性的必要性。或者,代谢模型可能能够预测未来的生态位互补性和群落稳定性,特别是如果它可以通过上述实验数据进行微调的话。
优先效应是指引入微生物类群的时机和在特定生态位中建立自己的优势(“先到先得”原则),已在各种宿主系统中进行了研究 [125]。这种现象也被广泛用于调节微生物群落恢复中的竞争 [126]。在实验室中解决 SynComs 的恢复问题时,一种新策略是将具有相似功能或分类的微生物分组,通过分别引入或消除每个微生物,推断某些群体与宿主表型之间的相互作用或关联 [14]。这种自上而下的策略需要大量的实验室工作,包括高通量自动化表型分析 [127, 128],以及模拟自然复杂性的受控无菌实验系统 [129, 130]。在众多相关努力中,EcoFAB(可重复的人工生态系统)的开发脱颖而出,成为标准化微生物群落模型系统的重要尝试 [131]。该系统促进了该过程中每个步骤的标准化,具有明确的微生物群落、实验室栖息地以及可重复的培养和时空分析方案。
协同生物信息学和高通量验证进行 Syncom 设计
高通量表型平台的发展以及云实验室的发展大大减轻了与表型分析相关的限制。在最近的研究中,研究人员将 136 个随机组装的不同规模的 SynCom 恢复到植物系统中 [132]。从这些试验中获得的实验数据被用作 ML 的数据集,从而成功识别出可预测表型结果的微生物菌株。虽然传统的 SynCom 设计方法可能对特定功能或作为简化的模型系统仍然有效,但这些新颖的概念框架对于处理大数据并从中提取有意义的见解是必不可少的。我们建议计算数据处理应涵盖跨不同维度的功能性状的整合,包括来自大规模功能测定和计算机预测的表型,这些表型可以根据实验数据进行校准和重新校准(图 2)。这将为每种候选微生物产生一个标准化的特征矩阵。结合不同的 SynCom 设计参数(包括群落大小、所需的分类多样性等),可以通过计算 SynCom 级别的功能性状和/或使用基于模型的策略来预测 SynCom 功能,从而评估生成的 SynCom。由此,可以构建具有来自不同分类来源的相似功能性状组成的多个替代 SynCom,这使我们能够并行探索多种可能的解决方案。高通量表型系统将在接种这些不同的 SynCom 后产生可处理的样本信息,包括植物生物量(通过 3D 扫描)、应激保护作用、生长形态、植物根系分泌物的变化(包括挥发性有机化合物 (VOC))和基因表达差异(通过转录组学)等参数。生成的组合及其表型数据可以重新用作基于 AI 的工具的输入数据,以学习和建模 SynCom 功能并预测群落级别的表型,并帮助选择新的 SynCom 设计以迭代提高性能。将来,建立 SynCom 相关数据集的数据库并探索基于与不同宿主和表型相关的大量 SynCom 数据集的相关性以识别实验室之间的基因型-表型模式可能是可行的。总体而言,我们提出的概念工作流程通过结合体外和体内测定以及计算预测的多维数据信息,为 SynCom 的设计提供了不同的视角。我们预计,这将加速在即将到来的微生物生态学研究时代采用 SynCom 作为有力的实验工具。
图 2 SynCom 设计的建议概念工作流程。 (a) 计算高通量 SynCom 设计和验证。首先通过实验/计算策略确定分离株和群落级别的功能性状。然后,将使用迭代设计-测试-学习循环,使用生成的性状矩阵进行高通量 SynCom 生成和验证。 (b) 高通量 SynCom 筛选和基于 ML 的分析。生成的 SynCom 将使用自动化高通量表型分析平台进行重构和表型筛选。观察到的表型分析数据集以及相关的宏组学,即根际宏转录组学数据,可用作基于 ML 分析的(扩展)训练数据,以增强对宿主-微生物组相互作用的理解,并设计出越来越有效和稳定的 SynCom。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-10 01:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社