mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

野生二粒小麦基因组在science发布

已有 14416 次阅读 2017-7-7 11:31 |系统分类:论文交流| 小麦, 基因组

野生二粒小麦基因组在science发布


     现代小麦是世界上的三大粮食作物之一,由于其基因组和复杂,它的基因组研究远远落后于水稻和玉米,迄今还没有一个较好的参考基因组发布。不过随着测序成本和技术的进步,今后一段时间小麦及其祖先种的基因组会陆续发布。我们餐桌上的小麦是一个异源六倍体物种,经历一系列的驯化才变成今天的小麦。研究已经表明六倍体小麦是由3个2倍体祖先种间2次种间杂交而来。第一次杂交形成异源四倍体野生二粒小麦,也即今天的主角。野生二粒小麦基因组的解读具有重要意义,不仅可以让我们更清楚的了解小麦的进化史,更重要的还可以发掘优异等位基因引入到小麦中。

   二粒小麦包括野生二粒小麦(Triticum dicoccoides Korn)和栽培二粒小麦(Triticum dicoccum Schuebl.)。染色体数2n=4x=28,染色体组型为AABB。穗扁平,每小穗结实2粒,穗轴易断,籽粒带皮(稃)大约10000年前,一种有14个染色体(二倍体)的野生小麦,称为一粒小麦(Triticum monococcum),与一种杂草山羊草(Aegilops sp.)杂交。这种杂草的正常二倍体也是14个染色体,但是它们与一粒小麦的14个染色体不同(不同源),因此不能配对,所以杂交后代是不育的。但是,由于低温,这个杂交后代忽然染色体加倍,形成了一个异源多倍体,即二粒小麦(Triticum dicoccoides)。二粒小麦具有28个染色体,或14对染色体。约3000年前,二粒小麦与节节麦,即粗山羊草(Aegilops tauschii)杂交,二粒小麦有28个染色体,山羊草只有14个染色体,杂交的后代又是不育的。由于低温,这个杂交种的染色体又忽然加倍,形成了具有42个(28+14)染色体的异源多倍体,即现在栽培的普通小麦。(引自百科)

    首先介绍下基因组组装中的各项指标如何。这个版本的组装没有利用PacBio序列,不能很好的跨越高度重复区域以及高GC含量区域,所以其基因组连续性仍然很不完美。其contig N50仅仅只有 57.378Kb, scaffold N50达到6.95Mb.

    然后利用遗传数据和Hi-C技术将这些scaffold组装至染色体水平。共组装出10.5Gb的序列,包括14条染色体以及不能放置至染色体的scaffold序列。接下来就是利用RNA_seq数据注释基因,共得到65012个高可信的基因。并且98.4%的BUSCO基因被注释出来,这说明基因组还是比较完整的。

   这些基因在染色体上的分布大体上两头多,中间少。14条染色体上的62813个基因中,大约有30.4%的基因在20个小麦不同发育阶段的组织中表达,48%的基因至少在其中一个或几个发育阶段表达,21.6%的基因表达水平很低或者没有检测到表达。



   野生二粒小麦是四倍体,每个基因理论上都有2个拷贝。实际同源性分析表明,大约72.3%的基因能够形成这种两两一组的配对。同源基因间的表达模式和水平高度相似。大约有1084个同源基因对只在A亚组表达,1115个同源基因对只在B亚组表达。基因功能富集分析表明,这些只在某一亚基因组表达的基因可能参与了小麦进化。

  82.2%序列被注释为转座子序列,并且亚基因组间的转座子含量相当。绝大多数(7.1Gb)转座子是LTR型(long-terminal repeat–retrotransposons )也即长末端反转录转座子,进一步可分为Ty1/copia-like, Ty3/gypsy-like 和未分类的。

  接下来就是对驯化基因-落粒基因进行解读。这一部分不再详细介绍,对这个基因感兴趣的小伙伴请自行阅读。

  为了检测其他可能受到选择的驯化区域。对一组野生和栽培二粒小麦进行外显子测序。从进化树上明显可以看到可分为野生和栽培两个亚群。野生二粒小麦亚群在进化树上可进一步被分为来自南部(以色列、叙利亚和黎巴嫩)和北部(土耳其)的亚群;而栽培二粒小麦亚群则被进一步分为来自印度洋、地中海、东欧和高加索地区的亚群。来自土耳其的栽培二粒小麦材料则存在于所有上述4个栽培二粒小麦亚群中。值得注意的是,在进化树上与野生二粒小麦靠的最近的是来自土耳其的栽培二粒小麦。土耳其恰恰也是假定的小麦进化地。


  总的来说,相比野生二粒小麦材料的遗传多样性(πW = 1.3 × 10^-3),栽培二粒小麦的遗传多样性只是稍稍降低(πD = 1.1 × 10−3)。依据多样性扫描,共有32和154个基因组区域被认为是潜在的受选择区域。对受选择区域内的基因进行GO富集分析发现,生长素响应基因显著富集。

 最后文章再次强调该基因组的解读在农业研究和生产中的重要性,不再详细描述。

资源下载地址:https://www.dropbox.com/sh/3dm05grokhl0nbv/AAC3wvlYmAher8fY0srX3gX9a?dl=0

文章地址:http://science.sciencemag.org/content/357/6346/93

微信公众号 wheatomics 聚焦小麦,发布小麦最新研究进展和资讯。随着小麦基因组的逐步释放,应用小麦组学方法会越来频繁,我们希望搭建一个免费平台介绍小麦组学研究的文章和方法,欢迎小麦同行扫码关注。





https://blog.sciencenet.cn/blog-1094241-1065083.html

上一篇:第一个接近完整的六倍体小麦基因组
下一篇:上哪个学校很重要?
收藏 IP: 58.213.93.*| 热度|

4 蔡小宁 王可骞 覃元元 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 19:47

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部