||
随着测序技术和生物信息学的快速发展,微生物组研究变得越来越复杂和多样化。现有研究表明,DNA提取、文库构建、测序平台和生物信息学分析方法的选择对结果有显著影响。不同的实验条件和方法组合可能导致结果的变异性,影响对微生物群落组成的准确评估。所以尽管有许多可用的分析方法,但由于缺乏统一的标准化流程,这导致不同研究之间的结果难以比较,同时缺乏对整个实验室过程和后续数据分析的综合评估。
如何标准化实验室和生物信息学步骤以获得可靠的结果,以及如何在不同研究中比较数据,是该文的主要研究难点。
为此,来自匈牙利赛格德大学医学院的研究人员开发了一个软件工具——Minitax,于近期发表在《Nature Communications Biology》期刊上。
Minitax主要用于处理和分析不同的宏基因组数据,并提供一致的分类结果,减少由于不同测序平台和方法引起的偏差,从而确保在多种实验条件下的可靠性和一致性。
方 法研究人员使用三种不同的样品类型来评估四种不同 DNA提取试剂盒的性能,这些样品包括狗粪便(n=6)和两种不同的标准微生物群落混合物 MCS 和 GMS(分别包括 8 种和 18 种细菌菌株)。
研究中湿实验部分的工作流程
使用狗粪便是由于已有研究表明犬类和人类的肠道微生物组在基因组成和功能上有许多相似之处。
狗粪便样本代表了真实的肠道微生物群落,能够反映出复杂的微生物生态系统及其多样性。
标准菌株则提供了一种已知的、标准化的微生物组成,可以作为对照,帮助研究人员评估不同实验方法的准确性和一致性。
研究中DNA提取、文库构建用到的试剂以及测序平台的详细信息如下图:
在DNA提取比较实验设计中,每种试剂盒做了四次重复,以确保结果的可靠性。然后评估提取的DNA的数量、质量和可重复性,包括DNA的产量、片段长度和微生物与宿主DNA的比率。
在文库制备方法比较实验设计中,评估文库的质量、体积和一致性,确保文库准备过程中的每一步都能产生高质量的样本。
在测序平台比较实验设计中,使用多种生物信息学工具(如DADA2、sourmash、Emu和新开发的minitax)比较不同测序平台生成的数据质量和微生物组组成的差异。
研究中测序数据分析的工作流程
在下游数据分析中:
使用α和β多样性分析评估和比较微生物群落的多样性以及差异;
使用PERMDISP方法分析样本的组内变异性,以评估不同处理方法对微生物群落组成的影响;
ANOVA分析后,使用Tukey HSD检验进行事后比较,确定哪些特定组之间存在显著差异;
使用卡方检验评估观察到的微生物组成与理论组成之间的差异,确定不同方法的准确性等。
主 要 结 果1来自真实肠道微生物群的湿实验结果
DNA提取试剂
Zymo Research的试剂盒在提取狗粪便样本的DNA方面表现最佳,提供了高质量和高产量的DNA;
Qiagen试剂盒则表现最差,导致较低的DNA产量和较高的宿主DNA污染。
如图a-f:
Z和MN试剂盒在提取的DNA片段长度上表现较好,
Z试剂盒的片段长度最长,MN试剂盒的片段长度稍短。
Q试剂盒的片段长度最短,显示出其在DNA完整性方面的不足。
在Z试剂盒中也产生了最高的DNA产量和最长的DNA片段长度,显示出其在提取高质量DNA方面的优越性,单因素方差分析(ANOVA)对不同试剂盒的表现进行了比较,结果显示不同试剂盒之间的差异显著,Q试剂盒的F值为511.63,p值小于0.0001。
在微生物组成的分析中,使用Z和MN试剂盒的样本在不同的文库准备方法下表现出相似的微生物组成,而Q试剂盒的样本则表现出明显的差异,准确性最低。
使用 I 试剂盒 的样本在微生物组成的准确性方面表现中等,且在不同样本之间的变异性较高。
如图g-i,α多样性分析显示Q试剂盒提取的样本在Shannon指数和Simpson指数上显示出显著的多样性降低,β多样性分析Q试剂盒的样本在多样性分析中表现出较大的离散性,这些发现强调了选择合适的DNA提取方法对微生物组研究结果的重要性。
文库制备
文库制备方法比较发现,对比DNA提取方法,选择合适的文库准备和测序方法对于获得可靠的微生物组分析结果更为重要。
如图a,α多样性分析显示,在短读长(SRS)文库中,除了Qiagen方法外,其他三种方法的丰富度和均匀度指标相似。在长读长(LRS)文库中,Invitrogen方法显示出较低的多样性,而Zymo和Macherey-Nagel方法则表现出较高的多样性。
图b,β多样性分析显示,样本的聚类更倾向文库制备而非DNA提取方法,V3-V4组与V1-V3组之间存在明显的分离,PERMANOVA结果显示,文库制备是决定微生物群落结构的主要因素,占总观察变异的59.4%,而“文库”因子占 20.1%,剩下 20.4% 的变异未解释。PERMDISP分析也显示(图d),样本的离散性在不同文库制备方法中表现出明显的变化。
图c 也进一步强调了文库制备对微生物群落分析结果的影响,表明文库制备对微生物群落的影响显著。
测序方法
在对门水平细菌组成的比较分析中发现使用I样本的V1–V3文库显示,Bacillota(以前称为Firmicutes)的比例最高,而Bacteroidota(以前称为Bacteroidetes)和Fusobacteriota(以前称为Fusobacteria)的比例较小。相比之下,V1–V2和V3–V4文库显示出更均衡的分布,Bacteroidota和Fusobacteriota的比例更为接近。结合补充数据(与其他相关研究的数据进行了比较),强调了不同测序方法对微生物群组成分析结果的影响。
DNA 提取方法
为了测试哪些 DNA 提取方法会表现出对革兰氏阴性细菌(G−)的偏好性或者是革兰氏阳性菌(G+),研究人员根据它们的细胞壁染色特征汇总了物种丰度并进行了分析。如下图,发现不同的DNA提取方法对G+和G−细菌的相对丰度有显著影响。
具体而言,只有I和MN这两种方法产生了近乎相同的G+与G−细菌比例,而其他方法则显示出明显的比例差异。这些差异主要归因于细胞壁对处理的不同抵抗力。
此外,在不同文库准备方法之间也观察到了显著的差异,尤其是V3-V4区域的比较结果尤为突出。这些发现强调了选择合适的DNA提取和文库准备方法对于准确反映微生物组成的重要性。
2来自标准微生物群落的湿实验结果
同狗粪便样本的实验设计,在DNA产量方面,Z 和 MN 试剂盒在两种样品类型中均表现出优异的性能,尤其是与 Q 和 I 试剂盒相比,在DNA片段长度方面,Z试剂盒产生平均长度最长,都超过 60,000 bps(下表数据)。
在文库制备方面,与粪便 DNA 样品中观察到的结果一致。在微生物组成分析中,发现Z方法在MCS样本中识别的物种数量最少,显示出与理论组成的高度一致性,而I方法在GMS样本中表现不佳,显示出较高的偏差(如图a)。
在不同的DNA提取方法对G+和G−细菌的影响方面,发现Q方法在MCS样本中倾向于高估G−细菌,而MN方法没有该趋势,但MN方法在粪便样本中具有该趋势,因此,研究人员认为MN方法虽然更倾向于提取G−细菌的DNA,但在复杂的粪便样本中,这种偏差可能会被掩盖,从而影响对G+和G−细菌的裂解。
对于这两种方法,被低估的G+细菌属主要为Lactobacillus和Limosilactobacillus,而高估的G−细菌属主要为Escherichia和Salmonella。因此研究人员建议,在GMS样本中,I方法则低估了G−细菌,MN、Q和Z方法的丰度则接近理论值。
3评估minitax在不同测序数据之间的表现
minitax是一款专为处理多种测序数据类型而设计的灵活的分类工具,旨在为多样化的测序数据提供一致的分析结果。它能够在不同的测序平台(如ONT、PacBio和Illumina)和文库类型(包括mWGS和16S rRNA)中进行分类分析。
核心功能包括:
初步比对:使用minimap2进行初步的读段比对,采用平台特定的参数设置。
比对过滤:根据MAPQ分值过滤比对结果,选择每个读段的最佳比对。
物种分类:确定每个读段的最低共同分类等级(“tax.identity”) 和相应的等级级别 (“tax.identity.level”)。
分类优化:提供多种选项来解决具有多个有效比对的读段,确保最终的分类结果反映出最可能和最具体的分类等级(例如,目、科、属)。
输出结果:将分类结果以.tsv格式汇总,并生成phyloseq对象,可用于后续分析。
1. 基于标准菌株DNA样品的ONT V1-V9 测序比较 minitax 与 Emu工具
图中y轴表示Pearson相关性r²值,结果显示,两者在使用相同数据库(Emu db)时的性能相似,表明minitax具有良好的稳健性。
卡方检验结果表明,仅在MCS 的 I 方法的情况下,使用 Emu 或 minitax(使用 Emu db)重建的微生物组成与理论组成没有显著差异。
因此观察到的差异可能更多地归因于DNA提取方法和其他因素,而非生物信息学工具或数据库选择。
2. 基于MCS样品 的 Illumina V1-V2 测序比较 minitax 、Emu 和 DADA2
研究发现Emu和minitax的工作流程在属级和物种级别上均显著优于DADA2。
虽然在物种级别上,Emu(使用Emu数据库)提供的r²值略高于minitax,但在MCS样本的V1-V2区域中,卡方检验结果表明,Emu和minitax重建的微生物组成与理论组成之间没有显著差异,这与ONT V1-V9测序结果一致。表明minitax在微生物组分析中的有效性和可靠性。
3. 基于MCS样品的PacBio HiFi WGS 测序数据比较 minitax 和 sourmash
结果发现,当包含未分类的reads时,minitax在丰度估计方面优于sourmash。然而,当排除未分类的reads时,minitax在种水平的表现略差一些,因为这会改变已识别分类的相对丰度。
通过使用三种不同的物种检测阈值进行的卡方检验表明,在使用0.1%和0.01%检测阈值时,minitax的结果与理论分布之间没有显著差异。
这些发现表明,minitax在处理包含未分类reads的数据时表现更佳,而在严格的物种级别分析中,可能需要考虑未分类reads的会造成的影响。
4. Minitax在模拟小鼠肠道数据集上的表现
CAMISIM小鼠肠道项目的模拟数据集包含来自PacBio和Illumina的各10个样本。在这两种数据类型中,minitax在门水平达到了r²=0.96,而在种水平,r²分别降至0.46和0.55。
这表明minitax在较高的分类水平上能够有效重建微生物组成,但在种水平上的表现略差,这也显示出不同测序平台对结果的影响。
4研究中不同试剂方法的优缺点整理
1. 各种DNA提取试剂盒的优缺点,包括DNA产量、片段长度、污染水平以及在不同样本类型中的总体表现
2. 文库制备方法的优缺点,包括每种制备技术相关的测序质量、一致性、实验复杂度和成本的优缺点
3. 推荐的湿实验流程
结 语该文通过对狗粪便样本和标准微生物群落的综合评估,呈现了湿实验过程中不同条件下产物的差异,同时比较和验证了新开发的生信分析工具minitax在肠道微生物分析中的可靠性和优势。
综合评估下,在DNA提取过程中,Zymo Research Quick-DNA HMW MagBead Kit在狗粪便样本和标准微生物群落样本(MCS、GMS)中表现最佳,具有高DNA产量、长片段、低宿主DNA污染、一致性好的优势。
在文库构建和测序过程中,Illumina MiSeq与Illumina DNA Prep的组合在数据质量和准确性方面表现最优异,具有高质量、高准确性、应用广泛的优势。文中还提出了一个重要的观点,认为文库制备方法的选择对样本聚类的影响大于DNA提取方法,强调了选择合适文库准备方法的重要性。
在生物信息学分析方面,研究人员将minitax与其他工具(如Emu和DADA2)进行了比较,结果显示minitax在不同测序数据类型中表现良好,能够提供一致的结果。
但minitax的局限性在文中也有展露,例如在使用NCBI数据库进行物种级别的分类时,minitax的精确度显著下降。这表明在物种识别方面,选择合适的数据库对结果的影响很大;minitax的有效性可能因样本类型而异,某些方法组合在特定样本中表现良好,但在其他样本中可能不够理想;在处理包含未分类reads的数据时,minitax的性能可能受到影响,尤其在种水平分析中;尽管minitax能够处理长读长数据,但在某些情况下还是不如专门为长读长数据设计的工具(如sourmash)。
不过对于这些局限性,研究人员在文中提出以下建议,对于需要跨平台比较和分析的研究,还是建议使用minitax与NCBI基因组集合,因为它在扩增子和宏基因组WGS测序数据的多样化研究中是稳健的;建议在扩增子测序中使用Emu以获得最佳效果;建议在宏基因组全基因组测序 (WGS) 中使用Sourmash以获得最佳效果。
总体而言,文章强调了在微生物组分析中优化实验和生物信息学流程的重要性,以确保结果的准确性和可重复性。
主要参考文献
Gulyás, G., Kakuk, B., Dörmő, Á. et al. Cross-comparison of gut metagenomic profiling strategies. Commun Biol 7, 1445 (2024).
本文转自:谷禾健康
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 14:50
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社