lyao222lll的个人博客分享 http://blog.sciencenet.cn/u/lyao222lll

博文

网络分析概述之微生物互作(生态)网络简介

已有 984 次阅读 2019-8-17 11:45 |个人分类:概述|系统分类:科研笔记| _网络分析

微生物互作(生态)网络分析简介

 

基于网络的分析方法被广泛地应用于数学、计算机学、社会科学和生物学等领域,可以用来探究学校中的社团、计算机网络中的节点、食物网中的物种、代谢通路中的蛋白质之间的相互作用。关于网络基础简介点击查看前文

生物系统通常表示为复杂的二元相互作用集或不同实体之间的关系。系统生物学的目的是在系统层面理解生物实体,除了在单组件(individual components)层面,还包含了互动系统(interacting systems)。与此相关的是网络生物学,其允许使用源自图论的工具来表示和分析生物系统。基本上,每个生物实体都与其他生物实体具有相互作用,从分子层面到生态系统层面,可通过网络反映/模拟生物学过程,如生态、神经、代谢或分子相互作用网络。

1.png

 

若提到生态网络,最容易想到的可能就是食物网了。如下展示了某草原生态系统中部分生物形成的食物网,一个有向网络。

2.png

这是宏观生物,微生物亦是如此。在自然环境中,微生物并不是以分离的个体形式存在,而是通过直接或间接的相互作用形成复杂的共发生网络。微生物之间的相互作用包括互利共生、共栖、寄生、捕食、偏害共栖和竞争等类型,相互作用会对参与者产生正向、负向和中性三种影响。同样地,环境影响群落的组成,因此微生物-环境之间也存在着密切的交互。微生物体积小、数量大、代谢旺盛、繁殖迅速,造成微生物群落在组成和功能上极高的复杂度,然而,在生态系统中直接探究这些不同的相互作用类型非常困难。

将某个数据集表示为网络图时,定义边的规则通常是两个相邻节点的某些属性具有足够程度的“关联”,例如通过“相关性”建立联系。这种“关联网络”(association network)可以再很多领域中见到,在微生物领域,关联网络分析为微生物生态学的发展提供了强有力的研究手段,并为探索环境中的复杂的微生物-微生物、微生物-环境等相互作用提供了有力的参考依据。近年来,网络分析被广泛应用在多种生态系统中,例如海洋、河流、湖泊、森林、农田、草地、活性污泥和人体,来研究微生物的共发生模式。网络分析能够揭示菌群中非随机的物种共发生模式,使物种间的直接互作或生态位共享特征得到较好的重现,对于我们理解微生物群落的组建机制、生态系统的功能以及识别群落中的关键物种至关重要。

 


微生物互作网络构建


我们不可能去用肉眼直接观测环境中的微生物,因此目前微生物群落数据的获得,基本上都借助于高通量测序技术。随着高通量测序技术的迅速发展,微生物数据的获得也越来越容易。通过高通量测序,我们可以很轻易地得知某一环境中微生物物种丰度组成(16S/18S/ITS扩增子测序,宏基因组测序)或功能基因丰度组成(宏基因组、宏转录组测序)。高通量测序以外的其它方法,如质谱,用作代谢组学研究。之后,我们可以通过构建互作网络,探究环境中的各方面交互作用,如微生物-微生物之间、微生物-环境之间、基因-基因之间、代谢物-代谢物之间等。

为了方便阐述,下文继续缩小范围,就主要以微生物物种之间的互作网络分析为例展开叙述。

 

微生物互作网络构建原理简介


如上所述,我们很难直接探究微生物之间的相互作用类型,因此,这里的微生物互作网络实质上是基于数学模型推断的。从最简单的相似性(相关性或距离)计算、到更复杂的多元回归和贝叶斯网络分析,多种方法可以被用来构建微生物共发生网络。这些方法的效率、准确性、速度和计算要求各不相同。其中基于两两物种之间相似性计算的方法具有构建速度快和易于操作的特点,因而最为流行。理论上,任何计算两两之间关系的方法都可以使用。例如:Bray–Curtis距离计算物种丰度之间的距离,Pearson相关系数评估线性关系,Spearman相关系数计算非线性关系等。

其中,相关性网络可能是其中最简单、最容易理解的一种方法了,主要依据物种丰度之间的 PearsonSpearman相关系数来构建共发生网络。如下展示了基于OTUs丰度间相关性的关系构建网络图的原理示例。(在16S/18S/ITS扩增子测序中,微生物类群的基本单位称为OTU,即Operational Taxonomic Unit,你可以大致理解为一种OTU代表了一种微生物,通常OTU很难定位到种水平,介于种到属之间;最后可获得每个环境样本中都包含了哪些种类的OTU,以及它们的丰度,并在此基础上,继续统计得到各门纲目科属等水平的微生物类群种类和丰度)


3.png

上述大致讲述了相关性网络的构建原理。更复杂的网络模型,本文不再细说(好吧其实我也看不太懂它们的算法……也就仅会用而已),大家有兴趣可自行查阅相关文献了解。

好了,我们看到这里构建的微生物互作网络是“无向网络”。毕竟该网络仅为由模型推断得到的,无法像上文中展示的那种“草原生物食物网”一样明确两两物种间的实际相互作用关系,因此通常不指明边的方向。尽管某些网络图构建算法会给出“方向”,但我们一般也会选择将方向信息忽略。在无向网络图中,谁和谁具有相关性、正相关还是负相关、相关性的大小等主要的边信息,这些需要保留。

 

对于高通量测序所得的细菌群落数据,除了在OTUs水平,我们也可以在属水平、门水平等分类单元中构建互作网络。根据具体所要关注的问题,选择在哪种水平构建网络,并且还需保证你能对你的结论作出合理的解释。如下图展示了OTUs水平的互作网络图(文献来源)。无论使用哪种分类水平,如果仅根据微生物类群的丰度数据来计算,不包含其它的非物种类型的数据,那么这种类型的网络图反映了“物种”间的直接或间接的相互作用。

4.png

当然,除了识别微生物类群-类群之间的互作,我们同样可将环境因子、功能基因等添加在内。即在构建微生物共发生网络时,将环境因子、功能基因等当成是“物种”加入,用来推测微生物与环境之间、种群与功能之间的相互关系等。在计算方法上和纯物种数据相比没有本质区别。不过相较于上述纯物种的互作网络,在这些网络中可能更侧重于体现物种-环境、物种-功能的关系。

如下示例(文献来源),使用网络分析了两种植物根际环境中主要的细菌OTUs和土壤理化属性的关系,反映环境对细菌群落组建的影响(图中仅展示了微生物-环境因子的相互作用,不关注微生物-微生物或环境因子-环境因子之间的相互作用)。节点不同的颜色代表对应的细菌OTUs归属于不同的细菌门(同时这些OTUs属于哪些细菌属,直接在节点中标识出属名),边的粗细对应相关性的强弱,红色的边代表呈正相关,蓝色的代表负相关。

5.png

再如下示例(文献来源),构建相关性网络反映环境中主要的细菌类群和抗生素抗性基因(Antibiotic resistance genesARGs)之间的关系,图中各节点反映了不同的细菌门(灰色节点)或抗生素抗性基因大类(彩色节点),连线(边)表示微生物和抗性基因存在相关(图中仅展示了微生物-抗性基因的关联度,不关注微生物-微生物或抗性基因-抗性基因之间的关联度)。边的粗细反映了相关性的大小,即相关性越大,表明该抗性基因的产生与该细菌类群的关联程度越大。

6.png

 

微生物互作网络构建的常用工具以及需要注意的问题


上文提到,无论微生物-微生物互作关系,还是微生物-环境因子、微生物-功能基因等的相互关系,我们均是根据数学的方法去推断的。在这方面,研究者们开发出了多种工具来构建共发生网络,常见的如分子生态网络分析(Molecular Ecological Network AnalysisMENA)、局部相似性分析(Local Similarity AnalysisLSA)、成分数据的稀疏关联分析(Sparse Correlations for Compositional dataSparCC)、CoNet分析等;在常用的开源语言Rpython中,也有很多被开发用于构建网络的包或模块,如igraph

不同的工具构建网络图的算法各有区别,适用情形也不一样。MENA分析将物理学中的随机矩阵理论(Random Matrix TheoryRMT)应用到共发生网络构建中,来自动确定相关系数的阈值(Deng et al. 2012)。在计算时间序列上的关系时,面临着一个问题:一个物种丰度对另一个物种丰度变化的响应需要一定的时间。LSA分析被用来处理这种迟滞效应带来的问题(Ruan et al. 2006)。采用高通量测序技术并不能获得微生物物种的绝对丰度,我们一般使用均一化后的OTU表,然后根据相对丰度计算任意OTU对之间的相关系数和显著性。OTU相对丰度表中任何一个样品的物种相对丰度之和为1,是非独立的成分数据。使用成分数据计算相关性可能会产生假阳性,也就是成分偏差。SparCC 分析通过计算对数转化后的物种相对丰度之间的Pearson相关系数,来针对性地处理成分偏差问题(riedman et al. 2012)。CoNet采用多种相关性和距离算法计算物种之间的关系,利用置换分析计算每个算法的p并将其合并,在最终的网络中仅保留那些在多个算法中同时显著的关系,同时解决了相似性分析带来的成分偏差问题和距离分析带来的异常值问题(Faust et al. 2012b)。开源语言Rpython中提供了非常多的网络构建模型供我们选择,简单的如基于相关性阈值和显著性p值筛选的网络构建方法,这也是常见的通用方法;更多的网络构建算法可能更为复杂,通常针对于特定的研究(一般可见相关文献中的描述)。话虽如此,但这里的互作网络毕竟仅为根据数学模型推断,所得结果并非“绝对真实”的相互作用,因此各种方法的适用条件、结果优劣等只是相对而言的。

大多数分析方法需要人为设定相关系数阈值、显著性阈值等来构建共发生网络,因此研究结果存在一定的主观性。例如在最常见的相关性网络中,对于PearsonSpearman相关系数阈值的选取,你选择0.60.7的结果肯定不同,显著性p值阈值选择0.050.01的结果肯定也不一样,但是你很难说明哪种阈值的选择是更合理的。再例如在CoNet分析中,如果你采用自动阈值法,相关性、相异性度量方法的选择,初始连线数的选择等也将显著影响最终结果。总之参数的选择没有确切的衡量标准,主观性是不可避免的。

无论你使用哪种网络构建方法,选择了怎样的参数,这些都没有明确的衡量标准,尽管去尝试。毕竟网络分析只是工具手段性质的,只要你能通过网络分析合理地解释科学问题/达到预期的效果,那么你选择的方法肯定是合适的。

网络构建还要求足够多的样本量,这是毋庸置疑的,这样才能充分体现物种丰度变化的协同作用。就拿相关性网络来讲,参考上文的“原理图”,图中对于OTUAOTUB互作类型(丰度变化趋势)的探究,根据16个环境样本的群落数据计算二者的相关性,结果清晰明了。假设此处仅有3个样本,那么OTUAOTUB之间相关性的计算是不是将会大打折扣?同样地,如果你还关注微生物和环境的关系,那么样点还最好覆盖一定的环境变化梯度,短梯度下(环境差异不大,甚至无明显差异)很容易出现偶然误差。当然,与上述网络构建方法、参数选择等相比不同,这里的内容属于试验设计性质的问题了,在你进行试验前就一定要慎重决定的。

 


微生物(生态)网络结构分析


网络分析是帮助理解微生物群落组建规则的重要手段之一,能够反映出菌群中可能存在的生态过程,如合作、竞争和生态位分化等,并为更好地认识生态系统中复杂的物种相互作用以及探索群落关键成员提供了新的思路。

共发生网络分析具备多种优点:通用性(数据可以是基因或者物种),可以整合不同的数据类型(物种的相对丰度数据和环境因子),可以适用于分层数据(可以在多个水平如 OTUs、属水平上构建),可以预测群落属性如生态位、核心物种。

 这里涉及到对网络拓扑结构的分析,可点击“节点和边特征”、“网络特征”了解网络基本特征。


反映生态位共享/重叠程度


当两个物种同相同的环境因素存在较强的相关性,意味着这两个物种具有一定程度的生态位重叠。同时,微生物共发生网络一般可以被划分成多个模块,模块是网络中高度连接的区域。模块可能反应了栖息地的异质性、系统发育上亲缘关系较近物种的聚集、生态位的重叠和物种的共进化,被认为是系统发育、进化或功能上独立的单元(Olesen et al. 2007)。

除了分析群落物种的共发生模式,网络分析还可以提供微生物群落构建方面的依据。微生物共发生网络的度符合幂律分布,即大部分物种具有少量的连接数,极个别的物种具有非常多的连接数,是典型的无标度网络Steele et al. 2011说明微生物群落构建方式是非随机的(Barberan et al. 2012)。共发生(正关联)可能反应出生态位的重叠,而共排斥(负关联)可能由生态位分化所引起。根据这一观点,我们可以推断非生物的环境选择作用或者生物之间的竞争作用在微生物群落构建中的重要性。当系统发育上亲缘关系相近的物种在观测网络中倾向于共发生,亲缘关系较远的物种倾向于共排斥时,意味着确定性过程在微生物群落构建中占主要地位。反之,当亲缘关系较近的物种倾向于共排斥时,而亲缘关系较远的物种倾向于共发生时,意味着竞争作用占主要地位(Perez-Valera et al. 2017)。Hu等(2017)在研究河流微生物共发生模式时发现,来源于同一纲和科的物种,以及Firmicutes中不同纲的物种倾向于共发生,而Proteobacteria和其他门的物种倾向于共排斥,说明环境选择和竞争作用在微生物群落构建中同时发挥作用。微生物网络结构会随实验条件或者环境改变而发生变化。例如,相比长期施用化肥,施用有机肥的农田其土壤微生物共发生网络结构更加复杂,功能微生物之间联系更加紧密(Ling et al. 2016);空气中CO2 浓度的增加使得土壤微生物功能基因网络结构更加复杂(Zhou et al. 2011),等等。

 

识别关键物种


在微生物网络中,有一些节点处于枢纽位置,这些核心节点的缺失可能会引起模块和网络的分解,因此在维持网络结构的稳定性中发挥重要作用。这些核心节点常被解读为关键种,在维持微生物群落结构稳定性上可能起重要作用。有三种方法常被用来鉴定这些核心节点。第一种是选择网络中连接数最高的一些节点, Eiler等(2012)据此发现放线菌门acTH1-A1分化枝上的物种是淡水湖泊浮游细菌网络中的核心节点;第二种是选择那些处于网络中心地位的,也就是中介中心性最高的一些节点,Gokul等(2016)据此发现在北极冰盖的细菌网络中,放线菌门的一些OTUs是核心节点;第三种更为复杂,根据节点的模块内连接度(Zi)和模块间连接度(Pi)将网络中所有节点归为四类:外围节点(Peripherals)、连接节点(Connectors)、模块中心点(Module hubs)和网路中心点(Network hubs),通常将连接节点、模块中心点和网络中心点这三类节点归为假定的关键种,Shi等(2016)据此在野燕麦根际网络中寻找核心OTUs

 

网络分析中需要注意的问题


尽管微生物网络分析据有很多优点,但毕竟只是由数学模型推断得到的,因此真实情况中所有的网络构建方法都不能区分出真正的生物相互作用和非随机的生态过程(例如互养和生态位重叠)。在构建好网络后,可以计算一系列的网络拓扑属性,虽然这些拓扑属性可以简化复杂的网络系统,但解读时如果不加注意,可能会得出错误的结论。例如中心节点常被解读成关键种,去除其之后被认为会引起微生物群落结构发生极大改变。但是中心节点的连接数多可能是由于生态位的重叠引起,在这种情况下,去除并不会引起微生物群落发生较大改变。相反,如果连接数少的节点是食物链顶端的捕食者,其去除会对微生物群落结构产生重大影响。

 

网络分析与其它技术的结合


使用网络分析来研究微生物相互作用带有强烈的推测性,因此越来越多的研究者将其和其他技术相结合应用。共培养是研究微生物相互作用最传统有效的实验手段。共培养实验在受控环境中人为构建群落,因此为验证有关群落稳定性和动态变化的生态理论提供了理想的条件。Harcombe2010)将Salmonella Typhimurium和不能合成蛋氨酸的Escherichia coli突变菌株共培养,发现这两株菌不能在醋酸培养基和葡萄糖培养基中生长,而在乳糖培养基上,S. Typhimurium可以利用E. coli分解乳糖的副产物同时产蛋氨酸供后者利用,说明互利共生可以通过实验进化来获得。传统的共培养技术一次只能研究少量的物种,要同时研究大量物种的关系,需借助其他技术。Lima-Mendez等(2015)利用激光共聚焦显微技术和三维重构技术证实了基于网络分析推测到的微生物间寄生关系。结合网络分析和荧光原位杂交技术,Cardinale等(2015)证实莴苣的根内生细菌间存在很大程度的生态位重叠。

 


参考资料


师兄的博士论文(觉得师兄总结得太好了,很多段话直接复制粘贴的,得到师兄允许了,嘿嘿;就是可惜师兄不让提到他名字和论文标题……)

Eric D Kolacayk, Gabor Csardi, 网络数据的统计分析:R语言实践(李杨 译). 西安交通大学出版社, 2016.

Network analysis of protein interaction data: an introductionhttps://www.ebi.ac.uk/training/online/course/network-analysis-protein-interaction-data-introduction/network-analysis-biology-0

 

Barberán, Albert, Bates S T, Casamayor E O , et al. Using network analysis to explore co-occurrence patterns in soil microbial communities. The ISME Journal, 2012, 6(2):343-351.

Cardinale M, Grube M, Erlacher A, et al. Bacterial networks and co-occurrence relationships in the lettuce root microbiota. Environmental Microbiology, 2015, 17(1):239-252.

Eiler A, Heinrich F, Bertilsson S. Coherent dynamics and association networks among lake bacterioplankton taxa. The ISME Journal, 2012, 6(2):330-342.

Gokul J K, Hodson A J, Saetnan E R, et al. Taxon interactions control the distributions of cryoconite bacteria colonizing a High Arctic ice cap. Molecular Ecology, 2016.

Hu A, Ju F, Hou L, et al. Strong impact of anthropogenic contamination on the co-occurrence patterns of a riverine microbial community. Environmental Microbiology, 2017.

Lima-Mendez G, Faust K, Henry N, et al. Ocean plankton. Determinants of community structure in the global plankton interactome. Science, 2015, 348(6237):1262073.

Ling N, Zhu C, Xue C, et al. Insight into how organic amendments can shape the soil microbiome in long-term field experiments as revealed by network analysis. Soil Biology and Biochemistry, 2016, 99:137-149.

Olesen J M, Bascompte J, Dupont Y L, et al. The modularity of pollination networks. Proc Natl Acad Sci U S A, 2007, 104(50):19891-19896.

Pérez-Valera, Eduardo, Goberna M, et al. Fire modifies the phylogenetic structure of soil bacterial co-occurrence networks. Environmental Microbiology, 2016.

Shi S, Nuccio E E, Shi Z J, et al. The interconnected rhizosphere: High network complexity dominates rhizosphere assemblages. Ecology Letters, 2016, 19(8):926-936.

Steele J A, Countway P D, Xia L, et al. Marine bacterial, archaeal and protistan association networks reveal ecological linkages. The ISME Journal, 2011, 5(9):1414-1425.

Zhou J, Deng Y, Luo F, et al. Phylogenetic Molecular Ecological Network of Soil Microbial Communities in Response to Elevated CO2. mBio, 2011, 2(4):e00122-11-e00122-11.

 



http://blog.sciencenet.cn/blog-3406804-1193912.html

上一篇:网络分析概述之网络拓扑属性-网络特征
下一篇:Beta多样性和生态相似性

1 田灿荣

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2019-9-24 16:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部