|
随着测序技术的进步与测序成本的进一步降低,越来越多的植物基因组完成了染色体水平的组装,但很多物种缺乏线粒体和叶绿体的参考基因组。植物线粒体基因组的完整组装可为细胞核质相互作用、植物进化以及培育植物雄性不育系等研究提供宝贵资源。然而,由于频繁的重组和细胞内基因转移事件,植物线粒体基因组的完整组装极具挑战性。传统的植物线粒体基因组组装存在完整性差、测序准确性低和成本高等问题,极大地限制了植物线粒体基因组的研究规模。
近期,南京林业大学尹佟明团队和中国农科院深圳基因组所武志强团队联合开发了一款高效的植物线粒体图形化基因组组装工具包(PMAT,图1),它不仅能利用超低深度的HiFi测序数据(最低1×)从头组装植物线粒体基因组,还能组装存在复杂结构的叶绿体基因组。作者测试了PMAT在不同类群中的组装能力,结果表明PMAT在组装准确性和完整性方面显著优于现有的细胞器基因组组装工具。此外,作者还利用苹果和杨树分离纯化后的线粒体DNA测序数据,验证了PMAT从WGS数据中组装线粒体基因组的准确性。PMAT的源代码可在https://github.com/bichangwei/PMAT上获取,具体的使用方法和参数说明可以查看推文「PMAT」植物线粒体图形化基因组组装工具。
图1 组装流程图
作者使用13种植物的不同测序数据量进行组装对比,评估植物线粒体基因组组装所需的最小测序数据(如下表)。结果表明,对于不同物种来说,由于线粒体基因组的拷贝数在植物细胞中存在很大差异,组装线粒体基因组所需的最小测序数据也差异很大。对于大部分物种而言,PMAT仅需要1×的HiFi测序数据就可以得到完整的植物线粒体基因组。但如果想捕获更多重复序列介导的线粒体构象,作者建议使用5X以上的核基因组覆盖深度(mitogenome覆盖度>20X)的HiFi测序数据,以获取完整的植物线粒体图形化基因组。 PMAT利用低深度的全基因组HiFi测序数据组装mitogenome的特点,可弥补植物细胞器基因组资源不平衡的缺点,对于规模化植物线粒体基因组组装具有极其高效且经济的效果,可广泛应用于不同规模的植物线粒体基因组研究。
南京林业大学毕长伟老师、北京市农林科学院申飞副研究员和中国林科院韩富川硕士研究生为论文共同第一作者,南京林业大学尹佟明教授和深圳基因组研究所武志强研究员为论文的共同通讯作者,同时南京林业大学毕业生渠堰墅博士、侯静副教授、许可旺副教授、徐立安教授和深圳基因组所贺文闯副研究员参与了该工作。
本研究得到了国家重点研发计划、江苏省重点研发计划、江苏省自然科学基金以及中国农业科学院创新计划项目的支持。
联系作者加入PMAT问题解决群(请备注姓名+单位+PMAT)
毕长伟, 南京林业大学,邮箱: bichwei@njfu.edu.cn; 微信号: (13770664619 )
韩富川, 中国林业科学院亚热带林业研究所,邮箱: hanfc@caf.ac.cn; 微信号: (h18437901321)
参考文献
Changwei Bi, Fei Shen, Fuchuan Han, Yanshu Qu, Jing Hou, Kewang Xu, Li-an Xu, Wenchuang He, Zhiqiang Wu, Tongming Yin. PMAT: an efficient plant mitogenome assembly toolkit using low coverage HiFi sequencing data. Horticulture Research. (2024). uhae023, https://doi.org/10.1093/hr/uhae023
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-2-20 12:46
Powered by ScienceNet.cn
Copyright © 2007-2025 中国科学报社