||
Complete, closed bacterial genomes from microbiomes using nanopore sequencing
译者:文涛 南京农业大学
责编:刘永鑫 中科院遗传发育所
Nature Biotechnology [IF:31]
2011-02-10 Articles
doi: https://doi.org/10.1038/s41587-020-0422-6
全文可开放获取 https://www.nature.com/articles/s41587-020-0422-6
第一作者:Eli L. Moss 1,Dylan G. Maghini1
通讯作者:Ami S. Bhatt1,2* (fog@mpi-bremen.de)
作者单位:
1 斯坦福大学遗传学系(Department of Genetics, Stanford University, Stanford, CA, USA)
2 斯坦福大学医学系(血液学,血液和骨髓移植)(Department of Medicine (Hematology, Blood and Marrow Transplantation), Stanford University, Stanford, CA, USA.)
① 虽然基因组中重复元件结构对于理解基因组功能至关重要,但使用常规短读长的测序去组装重复元件非常困难;② 本文提出一套测序流程(Lathe)结合长读长序列组装和短读长序列纠错可以从复杂的微生物群落中组装完整的基因组;③ 这套流程成功在12种细菌的模拟群落中组装出7个完整基因组,在13个人类粪便样本中组装了20个环状基因组;④ 这一方法将在研究微生物功能尤其是重复元件的作用等方面具有广阔应用前景。
点评: 基于二代测序让我们对复杂环境微生物群落组成和功能有了进一步的认识,然而更深层次的研究就需要从复杂环境中组装得到完整基因组,虽然三代测序准确率有待提升,但是却帮助我们将序列读长扩展到足够用的地步,可我们却还是无法从复杂环境中得到可用于三代测序的大片段DNA。因此,从复杂环境中组装完整基因组的工作,从样本提取就开始困难重重,本文提出了一整套方案,从样本提取到下游的生物信息学分析,带我们跨越障碍,组装高质量基因组。
微生物基因组通常使用短读长数据组装,但是组装的连续性受宏基因组测序重复元件(repeat elements)影响。正确的组装基因组重复元件的位置对于我们理解基因结构对基因功能的影响至关重要。我们的工作流程(作者称为:Lathe)结合了长读长组装和短读长纠错功能,可以从复杂的微生物组中组装完整的细菌基因组。我们用12种细菌的合成菌群验证了我们的方法。七个基因组被完全组装成一个单个的重叠群(contigs),三个基因组被组装成四个或很少的重叠群。接下来,使用我们的方法来分析来自13个人粪便样本的宏基因组学数据。我们组装了20个环状基因组,包括Prevotella copri和Cibiobacter sp的基因组。尽管与其他测序和组装方法相比核苷序列准确性降低,但我们的方法改善了组装连续性,可研究重复元件在微生物功能和适应性中的作用。
从宏基因组中组装得到细菌和古细菌的完整基因组(MAG,宏基因组拼接/组装基因组)是微生物组研究的长期目标。由于现有的宏基因组测序和组装方法通常无法组装完整的细菌基因组,因此通过对相似的重叠群进行分箱来得到基因组草图。这种方法已生产的数量可观的细菌基因组和扩展了我们的微生物群落的认知。分箱的质量很大程度上取决于数据量的大小和连续性。随着装配连续性的增加,基因组装箱的敏感性和特异性得到提高,因为需要将更少,更大的contigs分配到每个基因组。测序和组装技术(包括读云测序)的进步提高了组装基因组的质量,但在正确放置重复序列元件的能力方面仍然受到限制。重复元件的大小范围从几十个碱基对到几千个碱基。长读取数据可涵盖整个常见重复元件,例如:miniature inverted repeat transposable elements,转座子(transposons),基因重复(gene duplications)和噬菌体序列。
最近,纳米孔和PacBio的长读长方法已被应用到肠道和其他微生物组研究方向。然而,由于缺乏从粪便中提取超长(HMWhigh molecular weight 超大)DNA的有效方法,阻碍了长读长方法在肠道微生物组分析中的应用。标准的磁珠研磨可导致大范围基因剪切作用,尽管SPRI珠子的“清除”步骤可去除数百个碱基对中的DNA片段,但通常无法富集足够长的DNA片段以在细菌中进行组装重复元件。轻柔的研磨可以减少剪切,但可能无法从难以裂解的生物中提取DNA。因此,需要一种方法来提取可跨越革兰氏阳性细菌和革兰氏阴性细菌的重复元件的长DNA片段,以克服基因组装配中的局限性。
我们提出了粪便样品纳米孔测序的工作流程,包括DNA提取和基因组组装的详细实验方法(补充图1)。我们的DNA提取方案适用于培养细菌的提取,包括用裂解酶混合物对细胞壁进行酶促降解,然后进行苯酚-氯仿提取,然后进行RNAseA和蛋白酶K消解,重过滤柱纯化和SPRI大小选择。这种方法可从低至300 mg的粪便中产生纯高分子量(HMW) DNA,适合长读长测序平台测序。我们的生物信息学工作流程Lathe使用的是基于长读长序列组装,而不是最近有报道的诸如OPERA-MS之类的混合组装 NBT:宏基因组二、三代混合组装软件OPERA-MS。可以通过纳米孔或PacBio技术生成长读长数据。长读长组装和短读长校正与用于错误检测和基因环组装的修正。
Result
Fig. 1 | Taxonomic read composition, perorganism read-length distributions and genome assemblies in a defined 12-species bacterial mixture.
a,显示了模拟添加的相等细菌细胞组成和测序得到的的相对丰度计数,并校正了相对基因组大小。
b,每个细菌序列长度分布。在某些情况下,不同菌显示出不同的序列长度分布。
c,Circos图显示了纳米孔测序相对于短读取序列组装方法的相对组装连续性。纳米孔测序和装配(彩色外环)优于短读装配(黑色内环),在12例中有7例产生完整的基因组装配(圈图中的黑色点),另外3例组装成了四个或者少数contigs。数字表示以兆为单位的基因组大小。请注意,由于参考序列和装配序列中的线性化断点不同,因此完整的基因组可能包含一个明显的断裂。
Fig. 2: Per-organism assembly contiguity, diversity and taxonomic read composition in two healthy human stool microbiomes
a,上图显示了获得的序列数据集的物种水平香农多样性。在用本流程的DNA提取方法制备的文库中发现更高的物种多样性。下图展示了常规工作流程的相对物种水平丰度,常规测序数据由打珠研磨和基于短读长测序组成,而本文测序工作流程由HMW DNA提取和长读测序组成。
b,连续性表示为每单元N50除以每单个bin长度(分配给该bin的序列总长度)。随着bin装配接近完成,无论基因组大小如何,数量N50除以bin长度都将接近1。纳米孔测序和组装(蓝色,紫色)显示出比read-cloud (金色)和短读长测序(绿色)方法更高的组装连续性。图中展示对于通过任何方法达到至少500 kbp的N50组装或完整基因组草图的所有微生物,对于长读长,read-cloud和短读长都显示了基因组草图的质量和连续性。形状表示草图质量。星号标记了一个基因组,后来被注释为:putative Cibiobacter。
Read cloud是基于10X建库的方法,详见 NBT:宏基因组”读云”10X建库+雅典娜算法组装获得微生物高质量基因组
Table 1 Circular bacterial genomes assembled from human stool samples
Fig. 3: Circos diagrams of closed, circular genomes of P. copri and Cibiobacter sp.
a. P. copri 从样本P2-A中组装得到;
b,Cibiobacter sp1从样本P1中组装得到。 在两个图中,最外环代表给定微生物的完整,封闭和环化的基因组。中环和内环分别代表contigs来自read-cloud和短读长测序组装,他们被映射到纳米孔组装的基因组上。内部标记代表注释和预测的移动遗传元件(mobile genetic elements),例如插入序列(IS),transposases和prophage。
Short-read和read-cloud测序,使用Qiagen Stool Mini试剂盒使用标准的磁珠研磨机械裂解法从样品P1和P2-A中提取DNA。对于read-cloud建库,使用BluePippin(Sage Science)将其DNA片段大小选择为10 kbp。
对于HMW提取,将约0.7g的冷冻粪便等分到2 ml的Eppendorf管(Eppendorf)中,并用4-mm穿孔器(Integra Miltex)并悬浮在500 μl PBS(Fisher Scientific)中,并轻轻摇动,然后加入5 μl的lytic enzyme solution (Qiagen)混混匀。然后加入10 μl MetaPolyzyme(Sigma Aldrich;在750 μl PBS中复溶),并加入10 μl的裂解酶溶液(Qiagen),然后在37°C下孵育1 h。接下来,添加12 μl 20%(w / v)SDS(Fisher Scientific)和约100 μl用作锁相凝胶的真空润滑脂(Dow-Corning)。然后,加入500 μl pH 8的苯酚-氯仿异戊醇(Fisher Scientific),将样品轻轻涡旋5秒钟,然后以10,000 g离心。使用Legend Micro 21微量离心机(Fisher Scientific)离心5分钟。然后将水相倒入新的2-ml管中。
接下来,在室温下用90 μl 3M乙酸钠(Fisher Scientific)和500 μl异丙醇(Fisher Scientific)沉淀DNA 10分钟。上清混匀翻转三遍后,将样品在室温下孵育10分钟,然后以10,000 g离心10分钟。除去上清液,并用新鲜制备的80%(v / v)乙醇(Fisher Scientific)将沉淀洗涤两次。然后将沉淀在37°C下加热干燥10分钟,或直至沉淀外观无光泽,然后重悬于100 μl无核酸酶的水中(Ambion,Thermo Fisher Scientific)。接下来,以100 mg ml-1的浓度加入1ml Qiagen缓冲液G2、4 μl Qiagen RNase A 然后将样品轻轻倒转3次,然后在56℃下孵育90分钟。在30分钟开始,轻轻倒转一次,将沉淀物移出。
每个样品一个Qiagen Genomic-tip 20/G色谱柱用1 ml Qiagen缓冲液QBT平衡,并在重力作用下排空。将样品轻轻倒转两次,加到柱子上,使其流过。每列合并三份粪便提取物。然后用3 ml Qiagen缓冲液QC洗涤色谱柱,然后用1 ml预热至56°C的Qiagen缓冲液QF洗脱DNA。然后通过加入700 μl异丙醇沉淀洗脱的DNA,然后将其倒置并以10,000 g离心15分钟。用移液管小心地除去上清液,并用1ml 80%(v / v)乙醇洗涤沉淀。通过在37°C空气干燥10分钟除去残留的乙醇。随后将沉淀在4°C下重悬于100 μl水中过夜,无需搅拌。
然后使用改良的SPRI磁珠方案选择大片段的DNA。稍作修改:将小珠以0.9*添加,并将洗脱的DNA重悬于50 μl水中。然后分别用Qubit荧光计(Thermo Fisher Scientific),Nanodrop(Thermo Fisher Scientific)和TapeStation 2200或4200(Agilent Technologies)定量提取的DNA的浓度,纯度和片段大小分布(参见补充表1)。除非另有说明,所有步骤均在室温下进行。
所有序列数据,完整的基因组组装和单个完整的基因组都可以在NCBI BioProject上找到,登录号为PRJNA508395。
本文设计的流程代码:https://github.com/bhattlab/metagenomics_workflows/
后续分析,分箱注释可视化代码:https://github.com/bhattlab/lathe
利用纳米孔测序从混合样本中进行分析单个物种的基因组研究具有以下优点:
实时分析能够快速从混合种群中鉴定和量化个别微生物
长读长更利于微生物鉴定和基因组组装
不受地点限制:从实验室到极限环境,便携式MinION测序仪可在任何地方进行测序
利用上述优势,全球的科学家们利用Oxford Nanopore Technologies的测序技术进行宏基因组研究并获得了诸多前瞻性研究结论,如:
如果你也对纳米孔测序感兴趣,请扫描下方二维码与Oxford Nanopore Technologies 获得联系:
10000+: 菌群分析
宝宝与猫狗 提DNA发Nature 实验分析谁对结果影响大 Cell微生物专刊 肠道指挥大脑
为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍末解决群内讨论,问题不私聊,帮助同行。
学习扩增子、宏基因组科研思路和分析实战,关注“宏基因组”
点击阅读原文,跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 03:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社