|||
The water lily genome and the early evolution of flowering plants
摘要
睡莲属于被子植物门睡莲目。无柚樟目、睡莲目和木兰藤目一起形成了叫做ANA类的被子植物基部类群,是早期分化形成的被子植物。本文中,作者报道了蓝色花瓣睡莲的基因组序列,大小约为409Mb。系统发生基因组学分析显示无柚樟目和睡莲目是所有现存被子植物的基部类群,且无柚樟目处于最基部,而后是睡莲目。作者结合了蓝睡莲基因组和其它19个睡莲植物的转录组揭示了一次由睡莲科和葫芦科植物共享的全基因组复制事件。从这次全基因组复制事件中保留下来的基因参与了睡莲的成花转变和花发育过程。花发育相关的ABCE基因在睡莲中的广泛表达可能揭示了早期被子植物中可能具有类似的、但是广泛激活的古老ABCE花器官决定模型。与核心被子植物类似,睡莲演化出了花香和花色,作者鉴定了潜在的生物合成相关基因。基于化学成分分析和生物合成基因鉴定,作者发现睡莲的花香是与核心被子植物平行演化而来。睡莲在被子植物演化过程中具有独特的进化地位,因此该植物基因组的破译对于研究早期被子植物的演化具有非常重要的意义。
Among the genes retained from this whole-genome duplication are homologues of genes that regulate flowering transition and flower development.
正文
In addition, some water lilies have short life cycles and enormous numbers of seeds, which increase their potential as a model plant to represent the ANA-grade of angiosperms and to study early evolutionary events within the angiosperms.短的生命周期和大量的种子使其成为研究ANA级被子植物及被子植物演化的潜在模式植物。
N. colorata Peter:染色体2n = 28 and 基因组 409 Mb,具有蓝色花瓣,annotated 31,580 protein-coding genes and predicted repetitive elements with a collective length of 160.4 Mb, accounting for 39.2% of the genome
N. colorata基因组提供了一个机会,以解决Amborellales,Nymphaeales与所有其他现存被子植物之间的关系(图1a,b,c),three gymnosperm species (Ginkgo biloba, Picea abies and Pinus taeda) as an outgroup in turn。Among the LCN gene trees inferred from nucleotide sequences using G. biloba as an outgroup, 62% (294 out of 475 trees) place Amborella as the sister lineage to all other extant angiosperms with bootstrap support greater than 80% (type II, Fig. 1c). Using P. abies or P. taeda as the outgroup, Amborella is placed as the sister lineage to the remaining angiosperms in 57% and 54% of the LCN gene trees, respectively.
图1d是115种植物的系统发生树和时间尺度(44个基因组和71个转录组)。根据不同的标准,有5个的LCN基因集,包括1,167、834、683、602和445个基因。对这五个数据集的分析都得出了类似的树状结构,Amborella和Nymphaeales是所有现存被子植物的连续姊妹谱系。using a stringent set of 101 LCN genes and with age calibrations based on 21 fossils,inferred the crown age of angiosperms at 234–263 million years ago (Ma) (Fig. 1d). The split between monocots and eudicots was estimated at 171–203 Ma and that between Nymphaeaceae and Cabombaceae at 147–185 Ma.
Genomic collinearity unveiled evidence of a whole-genome duplication (WGD) event in N. colorata (Extended Data Figs. 1f, 2a and Supplementary Note 5.1)在睡莲中有一个WGD事件。通过比较N. colorata与其他Nymphaeales谱系、Illicium henryi和Amborella的同源谱系(代表物种形成事件)的KS分布和与N. colorata对应的KS分布,可以发现WGD发生在Nymphaeaceae和Cabombaceae分化之后 (图2a)。与此相反,通过对蓝色睡莲锚定区域中的至少一个旁系同源对的系统基因组学分析发现,睡莲的WGD事件在莼菜科和睡莲目之间共享。那可能有一部分WGD保留在了Cabombaceae中(图2b,c)。另一种解读,WGD的标志是一个异源四倍体事件,它发生在Nymphaeaceae和Cabombaceae祖先谱系分化后不久,它导致了Nymphaeaceae径谱系的形成(图2d)。
睡莲系起源于被子植物早期分化的一个分支,在被子植物辐射之前。因此,这个组提供了一个独特的窗口,了解被子植物的早期进化,特别是花卉。We identified 70 MADS-box genes, including homologues of the genes for the ABCE model of floral organ identities: AP1 (and also FUL) and AGL6 (A function for sepals and petals), AP3 and PI (B function for petals and stamen), AG (C function for stamen and carpel), and SEP1 (E function for interacting with ABC function proteins).(Extended Data Fig. 3)。
N. colorata ABCE同系物的表达谱在很大程度上与它们在花器官图案中假定的作用相一致(图3a)。其中。AGL6同源基因主要在花萼和花瓣中高表达,建议其为A功能基因。FUL主要在心皮中表达。C功能的AGa和AGb在雄蕊和心皮中高表达,AGb也在花萼和花瓣中表达,表明他们可能在睡莲WGD后经历了亚功能化从而可能导致了其在花组织发育中的新功能。双子叶植物和睡莲中的ABCE模型(图3b)。
花香是昆虫授粉媒介的嗅觉提示。无油樟目无香味,但是睡莲科有十一种易挥发的物质,包括萜类化合物(倍半萜),脂肪酸衍生物(癸酸甲酯),苯型烃类(图4a)。蓝睡莲基因组中有92个TPS基因,但只有四个家族:TPS-b,TBS-c,TBS-e/f和TBS-g(图4b),但是没有TBS-a(核心被子植物中负责倍半萜化合物的合成)。显著的,TBS-b包含了80个基因,其中NC11G0123420在花中高表达,说明有其他的基因调控倍半萜等合成。此外,在单子叶植物和真双子叶植物中未发现的癸酸甲酯,在睡莲中通过SABATH家族(13个SABATH同源基因,12个睡莲特有)的甲基化酶合成。其中NC11G0120830在花瓣中高表达(图4c)。其相应的重组蛋白以癸酸为底物,是活性最高的脂肪酸甲基转移酶(图4d)。这些结果表明,睡莲花香生物合成是通过酶的功能完成的,而酶的功能是独立于被子植物的功能而进化的
蓝色睡莲的蓝色花青素主要是由delphinidin 3′-O-(2″-Ogalloyl-6″-O-acetyl-β-galactopyranoside)决定的(Extended Data Fig. 8)。我们发现一个花青素合成和一个飞燕草素修饰酶在蓝色花瓣中高表达,相对于白色花瓣(Extended Data Fig. 8d,e),这两个酶催化花青素合成的最后两个步骤,因此他们是蓝色睡莲中蓝色色素合成的关键酶。
睡莲分布于全球,包括寒冷地区(中国和加拿大北部),这一点和其他的ANA级被子植物无油樟目和莼菜科有很大区别,这主要是跟睡莲的免疫和胁迫响应基因有关,如NLR(encoding nucleotide-binding leucine-rich repeat (NLR) proteins)和WRKY转录因子,蛋白激酶等(Extended Data Fig. 9)。
名词解释
whole-genome duplication (WGD):全基因组复制,同源多倍化多来自于种内全基因组复制,异源多倍化多来自于种间杂交。百万年前的全基因组复制事件造成了古多倍性(Paleopolyploidy),其来源于单 一物种的基因组加倍(同源多倍化,Autopolyploidy)或者两物种间的杂交(异源多倍化,Allopolyploidy)。由于复制后的功能冗余,很多基因迅速发生沉默或者丢失。 因此,在进化过程中全基因组复制后的基因组会经历二倍化事件而丢失它们多倍化 的状态。古老WGD检测有两种方法,一种是共线性分析,另一种则是根据Ks分布图。其中Ks定义为平均每个同义位点上的同义置换数,与其对应的还有一个Ka,指的是平均每个非同义位点上的非同义置换数。如果没有WGD或是大片段重复,那么基因组中的旁系同源基因的同义置换符合指数分布(exponential distribution), 反之,Ks分布图中就会出现一个由于WGD导致的正态分布峰(normal distributed peak). 而古老WGD的年龄则可通过分析这些峰中的同源置换数目来预测(Tiley et al., 2018)。越来越多的共识认为,被子植物至少经历两次 WGD 事件,一次 WGD 发生在所有 种子植物的祖先中,另一次 WGD 发生在所有开花植物的祖先中,这使得每个现存被子 植物事实上是包含至少两个 WGD 的残余物的古多倍体(Jiao, et al. 2011)
直系同源(Orthologs):直系同源的序列因物种形成而被区分开,若一个基因原先存在于某个物种,而该物种分化为了两个物种,两个物种中的相同的基因功能未变化,那么新物种中的基因是直系同源的。
旁系同源(Paralogs):旁系同源的序列存在于同一个物种。旁系同源的序列因基因复制而被区分开,若生物体中的某个基因被复制了,功能改变了,那么两个副本序列就是旁系同源
bootstrap support (BS)
low-copy nuclear (LCN) genes
本文亮点
1.高质量的睡莲基因组绘制(三代测序SMRT),提供了一个全新的被子植物基因组研究参考系。(基因组研究)
2.使用了大规模的比较基因组学研究(115种植物),将睡莲的分类地位进行了全新的注解,并对被子植物的系统发育关系提供了参考。(比较基因组学,系统发育和演化)
3.揭示了睡莲中的一个特定WGD事件,对睡莲和无油樟目的分化进行了合理的解释,并对被子植物的演化提供了创新的见解。(比较基因组学,睡莲演化过程中的独特事件)
4.对睡莲花的发育调控、花香的生物合成、蓝色花瓣的决定因素和睡莲抗寒作出了创新的见解,(功能基因组学,转录组学,性状位点关联,比较基因组学)
几点问题:
为什么染色体大小随染色体编号而减小(是因为染色体编号是由染色体大小决定?)
关于这一段描述不太理解”This wider expression pattern, in combination with broader expression of at least some ABCE genes in some eudicots representing an early-diverging lineage11, some monocots12 and magnoliids13, suggest an ancient ABCE model for flower development, with subsequent canalization of gene expression and function regulated by the more specialized ABCE genes during the evolution of mesangiosperms, especially core eudicots8 . This could also account for the limited differentiation between sepals and petals in Nymphaeales species, and is consistent with a single type of perianth organ proposed in an ancestral angiosperm flower“
论文地址:https://www.nature.com/articles/s41586-019-1852-5
通讯作者:张亮生
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-16 14:32
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社