keifei的个人博客分享 http://blog.sciencenet.cn/u/keifei

博文

植物分子系统学的大数据简介

已有 5415 次阅读 2020-7-24 06:55 |个人分类:文献|系统分类:科研笔记

现在确乎是大数据时代了,植物系统学界亦然,尤其是测序价格也越来越便宜。

1、基因组

越来越多的植物基因组被测序。我在参加近年国内植物系统与进化会议时发现几乎每个作报告的人都有基因组数据在手。国内的许多农、林、中医等科研单位也在密集地上马基因组项目。据我所知,原来做经典分类的一些老师也都在“玩“基因组了。“土豪”的华大甚至把一个植物园内的七百多种被子植物都测了基因组1

2、转录组

也有越来越多的转录组被测序。最典型的是华大公司的1KP项目,项目与数据详情见https://db.cngb.org/onekp/,发表了很多文章,汇总性成果发表在2019年发表的Nature2。不过从文章发表来看,该项目科研上以外国人为主导,样品也主要由外国科学家提供,华大主要负责测序、拼接等。这个项目结束后,华大又发起了10KP项目(介绍详见https://db.cngb.org/10kp/),不清楚这个数据到底是基因组还是如1KP的转录组。国内使用转录组数据研究植物系统的一个主要力量是复旦大学马红教授领导的团队,开展了被子植物大系统以及一些代表性科的系统发育研究3-8,鄙人也有幸参与了一部分的工作。

这一方法优点是可以较经济地获得大量的核基因,不仅可以分析系统发育,而且还可以开展其他相关分析,如基因家族进化、基因表达分析、WGD等,但主要缺点是样品质量要求高,一般需活体材料。

3、叶绿体基因组

这方面的数据也是井喷。最具代表性的工作是中科院昆明植物所李德铢老师团队的植物叶绿体基因组工作,开发了相应的软件9,2019年发表了一篇在Nature Plants的文章10。相信他们还在继续增加样品,特别是与国外各大标本馆合作。他们的目标是把叶绿体基因组数据推动为下一代的植物DNA条形码。另Mitochondrial DNA Part B这个期刊近年来发表了非常多的国人单个叶绿体基因组报道的文章,但由于被怀疑根本没有同行审稿,开始被很多单位列入黑名单期刊了。

叶绿体基因组的应用优点有:一是在细胞中拷贝数极多,因此甚至年代久远的馆藏腊叶标本只需一点材料就可以通过目前的测序技术获得完成的叶绿体基因组序列;二是,高度保守性,序列比对与分析容易。主要缺点:一,单亲遗传,而被子植物杂交、渐渗等网状进化很普遍,因此叶绿体基因组系统树无法完整反映进化历史;二,在近期辐射分化类群可能分辨率不够;三,很多寄生植物丢失了绝大多数叶绿体基因。

4、大数据的传统PCR方法测序得到的分子片段

这个大数据主要体现在覆盖物种多。以中科院植物所陈之端老师课题组主持的中国植物生命之树工作为代表,他们的工作首先集结在2016年JSE一期专刊(http://www.jse.ac.cn/EN/volumn/volumn_647.shtml),然后2018年在Nature上发文11,之后有更进一步的中国植物区划等工作12-14,最近还出版了《中国维管植物生命之树》15一书。他们还构建了一名为DarwinTree的技术平台(http://www.darwintree.cn/index.shtml)。

该方法的优点是经济、DNA质量要求不高、有大量公共数据使用;主要缺点是可用、好用的分子标记很有限,尤其核基因在设计通用引物、PCR扩增以及可能的非单拷贝需克隆再测序等。

5、靶向富集(Target Enrichment)测序数据

这是英国邱园主持的“植物与真菌生命之树”(Plant and Fungal Tree of Life,PAFTOL)项目所使用的大数据方法。关于这个项目,我也是近日在查文献资料偶尔得知的,大概不少同业者此前也未听说过,因此在这稍详介绍之。

该项目大概是2017年深圳国际植物学大会前后1KP数据的释放公开后才开始启动的。他们根据1KP的转录组数据选择一些典型物种筛选出353个直系低拷贝核基因,以此设计出一套探针,名为Angiosperms353 probe set。该方法已发表在Systematic Biology上16,起点很高。

这个方法大致结合了转录组与传统PCR测序两方的优点:一,这些相当数量的低拷贝核基因基本可以解决种以上各等级间的系统关系,甚至也有在群体遗传学研究上应用成功的例子;二,可以用标本馆里的腊叶标本材料,这为尽可能包含更多取样带来极大方便;三,单个样本的数据量不大,成本较低,非常适合于有大量取样的研究。当然,由于该方法在基因数目与种类已确定死了,因此探针的设计非常关键。Angiosperms353是根据1KP的转录组数据设计出来的,而并非根据可能更合适的基因组数据设计出来的,这当然跟目前已测基因组的物种还偏少,在系统上分布不均的缘故。该探针可能在科内等较低分类阶元更合适,而在较高分类阶元如科之间、目之间的解析度尚不清楚。因此,当构建跨科、目的大树时,可能因解析度不够而影响应用。这套基因的普适性如何还需在各分类阶元等级的类群中检测。另外,对于特殊类群如多倍化、近期辐射分化、寄生类群等,这套基因若也想能一网打尽,恐怕是很困难。

这个项目目标很宏大,主要依托于Kew丰富的栽培、种子和标本材料,目标是对地球植物的所有14000个属测序构建生命之树。从近两年的美国Botany会议上的报告可见其迅猛发展的端倪。

1)2018年美国Botany会议的一报告首次介绍该项目http://2018.botanyconference.org/engine/search/index.php?func=detail&aid=300)

2)2019年美国Botany会议上,介绍该项目已完成25%的所有被子植物属的测序,有5个使用此技术的报告。

Conservation Genomics of Plant Populations in Guadalupe Mountains National Park using Herbarium Specimens

Developing a cost-effective workflow for targeted sequencing of herbarium specimens using Angiosperms353

Lewis’s lost Lomatium found: Investigating species boundaries in the rare plant species subcomplex, Lomatium packardiae/anomalum

Phylogeny and Biogeography of Neotropical genus Freziera (Pentaphylacaceae)

The Plant and Fungal Trees of Life (PAFTOL) project: a case study from the carrot family (Apiaceae)

3)今年2020年7月底即将召开的美国Botany线上会议上更是组织了一个名为“Angiosperms353: A new essential tool for plant systematics”的专题。据介绍,该项目已完成5000个以上样品的测序,覆盖了30%以上的所有14000个被子植物属。本次大会有14个相关报告。

Completing the Flowering Plant Tree of Life with Angiosperms353

A phylogenomic approach to decode contentious relationships across flowering plants

A phylogenomic investigation into polyploidy and cryptic diversity in the true blueberries (Vaccinium section Cyanococcus)

Biogeography and ecological niche evolution in Diapensiaceae inferred from phylogenetic analysis

Cabinet to table: an artisanal approach to get the most out of Angiosperm-353 data from herbarium specimens

Improved and automated marker recovery from targeted capture data

On the potential of Angiosperms353 for population genomics

Phylogenomics and Breeding System Evolution of Australian Solanum (“S. dioicum group”, Solanaceae)

Phylogenomics of Hamamelis and Castanea with 353 Angiosperm genes and RAD-seq data – A proposed approach for cleaning the paralogs

Phylogenomics of Puya (Bromeliaceae): evolution in the dry valleys and high-elevation ecosystems of the Andes

Phylogenomics of the genus Hosta: Disentangling the impact of an ancient polyploid event on phylogeny resolution

Resolving generic limits in Cyperaceae tribe Abildgaardieae using targeted sequencing

Revisiting the Chilean Puya (Bromeliaceae) hypothesis using a phylogenomic approach with the Angiosperm 353 probe set

Testing hypothesized reticulate evolution in the Cornales using targeted enrichment dat

该项目更多信息,可见:https://www.kew.org/science/our-science/projects/plant-and-fungal-trees-of-life

此外,据我所知,中科院植物所标本馆的馆藏标本已批量被提了DNA。由于离所已久,尚不清楚他们将采用何种策略与技术测序与分析进展,现今进展如何也未可知。

p.s. 关于植物系统发育分析研究中使用的二代测序技术方法综述,可参见JSE的一篇综述17

基因组、转录组、叶绿体基因组、PCR基因片段、靶向富集。。。倘若逐年统计起来,这些数据大概都呈指数等级的增长。植物分子系统发育学到如今也才30多年,很难想象再一个30年之后该学科会发展成什么样子,那时测基因组是否会如同现在做PCR一般普通呢?


引用文献:

1 Liu H, Wei J, Yang T, et al. (2019) Molecular digitization of a botanical garden: high-depth whole-genome sequencing of 689 vascular plant species from the Ruili Botanical Garden. GigaScience 8(4): giz007. https://doi.org/10.1093/gigascience/giz007

2 One Thousand Plant Transcriptomes Initiative. (2019) One thousand plant transcriptomes and the phylogenomics of green plants. Nature 574: 679685. https://doi.org/10.1038/s41586-019-1693-2

3 Zeng L, Zhang Q, Sun R, et al. (2014) Resolution of deep angiosperm phylogeny using conserved nuclear genes and estimates of early divergence times. Nature Communication 5: 4956. https://doi.org/10.1038/ncomms5956

4 Huang CH, Sun R, Hu Y, Zeng L, et al. (2016) Resolution of Brassicaceae phylogeny using nuclear genes uncovers nested radiations and supports convergent morphological evolution. Molecular Biology & Evolution 33: 394412. https://doi.org/10.1093/molbev/msv226

5 Zeng L, Zhang N, Zhang Q, et al. (2017) Resolution of deep eudicot phylogeny and their temporal diversification using nuclear genes from transcriptomic and genomic datasets. New Phytologist 214: 13381354. https://doi.org/10.1111/nph.14503

6 Xiang Y, Huang CH, Hu Y,  et al. (2017) Evolution of Rosaceae fruit types based on nuclear phylogeny in the context of geological times and genome duplication. Molecular Biology & Evolution 34: 262281. https://doi.org/10.1093/molbev/msw242

7 Guo J, Xu W, Hu Y, et al. (2020) Phylotranscriptomics in Cucurbitaceae reveal multiple whole-genome duplications and key morphological and molecular innovations. Molecular Plant (in press). https://doi.org/10.1016/j.molp.2020.05.011.

8 Zhang C, Zhang T, Luebert F, et al. (2020) Asterid phylogenomics/phylotranscriptomics uncover morphological evolutionary histories and support phylogenetic placement for numerous whole genome duplications. Molecular Biology and Evolution (accepted).  https://doi.org/10.1093/molbev/msaa160

9 Qu J, Moore MJ, Li D-Z, Yi TS (2019) PGA: a software package for rapid, accurate, and flexible batch annotation of plastomes. Plant Methods 15: 50. https://doi.org/10.1186/s13007-019-0435-7

10 Li HT, Yi TS, Gao LM, et al. (2019) Origin of angiosperms and the puzzle of the Jurassic gap. Nature Plants 5(5):46170.  https://doi.org/10.1038/s41477-019-0421-0

11 Lu L., Mao L., Yang T. et al. (2018) Evolutionary history of the angiosperm flora of China. Nature 554: 234238. https://doi.org/10.1038/nature25485

12 Ye JF, Lu LM, Liu B, et al. (2019) Phylogenetic delineation of regional biota: A case study of the Chinese flora. Molecular Phylogenetics and Evolution 135: 222229. https://doi.org/10.1016/j.ympev.2019.03.011

13 Hu HH, Liu B, Liang YS,  et al. (2020) An updated Chinese vascular plant tree of life: Phylogenetic diversity hotspots revisited. Journal of Systematics and Evolution (accepted). https://doi.org/10.1111/jse.12642

14 Zhang XX, Ye JF, Laffan SW, et al. (2020) Spatial phylogenetics of the Chinese angiosperm flora provides insights into endemism and conservation. BMC Evolutionary Biology (under review).  https://doi.org/10.21203/rs.2.15239/v2

15 陈之端路安民、刘冰等. (2020) 中国维管植物生命之树. 科学出版社.

16 Johnson MG, Pokorny L, Dodsworth, et al. (2019) A Universal Probe Set for Targeted Sequencing of 353 Nuclear Genes from Any Flowering Plant Designed Using k-Medoids Clustering, Systematic Biology 68: 594–606. https://doi.org/10.1093/sysbio/syy086

17 Zimmer EA, Wen J (2015) Using nuclear gene data for plant phylogenetics: Progress and prospects II. Next‐gen approaches. Journal of Systematics and Evolution 53(5): 371379.https://doi.org/10.1111/jse.12174







https://blog.sciencenet.cn/blog-56870-1243339.html

上一篇:《国家重点保护野生植物名录(征求意见稿)》的几点个人建议
下一篇:解决linux中libuuid.so.1找不到版本的报错
收藏 IP: 58.49.32.*| 热度|

3 朱朝东 张金龙 许祖昌

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 00:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部