||
外显子测序揭示基因渗入对小麦环境适应的作用
(13)下面是文献部分。今天我给大家带来的这篇文献是19年发表在NG上的一篇文章,作者通过对890多个现代小麦进行外显子重测序,绘制了现代小麦中来自野生小麦的基因渗入图谱,并分析了其在小麦在进化过程中对环境适应性的作用。
【作者】
(14)首先我先介绍一下本文的通讯作者。Eduard Akhunov,是美国堪萨斯州立大学植物病理学系的教授,他们实验室主要进行小麦环境适应性的基因组学和遗传学、 小麦-病原菌互作机制、基因编辑、小麦的基因组多样性和进化机制等的相关研究,这是他们实验室发表的一些重要的文章,还是很高产的一个实验室。
(15)下面介绍一下本篇文章的第一作者,贺飞,2006年本科毕业于西南大学,2011年于中国农业大学获得生物信息学博士学位。先后在美国的斯隆凯特琳癌症中心、布鲁克海文国家实验室、伊利诺伊大学香槟分校做博士后,发表这篇文章的时候是在堪萨斯州立大学Akhunov的实验室做第四站的博后。今年是到了遗传所做了PI,他们课题组呢,还将以小麦为研究对象,通过大数据分析,解析小麦抗病相关的机制以及采用比较基因组学、群体遗传学、生物信息学、分子生物学等多种手段研究复杂多倍体基因组的进化与调控规律,探索小麦远缘杂交的分子机制。
【背景】
下面介绍一下本文的背景。
(16)首先是介绍一下小麦的起源。面包小麦是具有三个密切相关的亚基因组(AABBDD)组成的异源六倍体。它被认为起源于两次多倍化事件: 第一次是在距今约50万年的时候,野生一粒小麦(Triticum urartu Tumanian ex Gandilyan,AA)与拟斯卑尔脱山羊草(Aegilops speltoides Tausch)杂交形成的四倍体—野生二粒小麦;然后在新月沃土地带被驯化为栽培二粒小麦;第二次是在距今至少一万年前,二粒小麦(AABB)与野生二倍体节节麦(DD)杂交形成的六倍体,也就是现代的面包小麦。
我引用的这张图呢是和我讲的这篇文章去年同期发表在NG上的一篇文章,它也是通过外显子测序技术补充解释了现代小麦的起源,他们还基于网络的系统发育方法重建了现代六倍体小麦的网状进化历史,证实了不同基因组的具体物种来源。
(17)但是,就在小麦进化的过程中,驯化和多倍化却给小麦的遗传多样性产生了遗传瓶颈。有文献将野生二粒小麦和现代小麦对比发现,各染色体上的遗传多样性发生了一定程度的丢失。特别是D基因组相比于他的二倍体祖先,丢失的更加显著。那么AB基因组为什么没有发生类似的大量的丢失呢?
(18)因此就有学者分析认为,很有可能是因为AB基因组中存在来自野生小麦的基因流的渗入,提高了其遗传多样性。
(19)那么基因流是什么呢?它是群体遗传学上的一个概念,指通过基因交流向群体中引入新的等位基因,改变群体“基因库”的组成,是遗传变异一个非常重要的来源,可以影响群体遗传多样性。在植物中,他主要是借助花粉、种子、孢子、营养体等遗传物质携带者的迁移或运动,在植物的许多个生命阶段来实现的。
(20)基因渗入现象在植物群体中是普遍存在的,大豆、马铃薯、玉米、大麦等有报道,并且也发现了它对于提高植物的环境适应性具有一定的潜力。然而在小麦中,对基因渗入还知之甚少。因此能够明确小麦中基因渗入的范围、模式和作用,对于了解小麦的进化历程,提高现代小麦的遗传多样性,改善环境适应性具有重要的意义。
那么作者是怎么做的呢?
【结果】
(21)作者是对890个landracss和cultivars的外显子重测序数据进行分析的,图中展示的就是测序物种的来源,可以看到大多是一些欧洲、澳大利亚和美国的品种,对其进行比对和过滤,最终在现代小麦中确定到了约357万个SNP位点,再将其与之前野生小麦和驯化小麦的SNP数据库合并获得了总的数据库。
然后作者对各品种进行群体遗传结构分析,可以看到,在K=11时能够更准确的展现出不同品种中来自祖先基因组的比例。但为了更直观的区分出野生小麦和驯化小麦,作者是在K=7下进行分析的,此时计算出驯化小麦和现代小麦分别拥有21.9%和0.6%的野生小麦的基因组。
(22)然后作者又进行了遗传分化指数FST指数的计算,可以看到,相比于cultivars,野生四倍体小麦和landracss之间的遗传分化更大,因此作者认为,在现代小麦和野生小麦之间,遗传分化与品种改良程度是呈负相关的。
此外作者还发现,地缘邻近确实有助于遗传分化指数的降低,因此作者推测,除了遗传漂变和自然选择能够驱使野生小麦和现代小麦之间遗传距离的改变,可能同地区内各品种之间发生的基因流对于基因分化也有一定的作用。
同样的,作者还根据对野生物种K=3时的分类结果,对野生小麦和landracss进行了三品种的f3检测,Z值都小于-4,也同样表明了野生小麦到现代小麦之间存在着基因流。
(23)至此证明了群体之间确实是存在基因流的,那在分子水平上呢?于是作者接下来进行了fd 检验,计算两个品种之间共同突变基因的比率,从图中我们可以看到,landracss中基因渗入的比例更高,此外作者在landracss比cultivars中计算了来自野生小麦的基因的比例,也得到了相同的结论。
(24)FI是指基因基因渗入的频率,它同时受到基因流的强度和在基因渗入区域受到选择强度的影响,可以看到它和Fd指数成正相关,并且在小麦中随着FI的升高而基因渗入区域的数量在减少。
从图e中可以看出,随着基因渗入频率的增加,小麦的基因多样性增加,而FI和FST指数和分化指数都成负相关,并且这种现象在野生小麦和驯化小麦中是不存在的。这可以进一步说明小麦基因多样性的增加不是由共同祖先在相关区域发生中性变异造成的,而可能是野生小麦是有针对性的基因渗入导致的。
(25)那么这个Fd检验的方法究竟可不可靠呢?于是作者就利用了之前报道过已经确认是从野生小麦中渗入到现代小麦中的一个基因ABCT进行验证。可以看到fd检验的结果表明,在土耳其和欧洲的现代小麦品种中,ABCT位点的基因渗入频率更高;而且此基因流主要是从来自于以色列的中部和北部的South1;这均与之前的报道是一致的。
此外可以看到,作者在4A染色体上发现了一段区域,这个区域上FI指数很高,相应的Fd指数也高于其他区域,FST指数比全基因组都低,且基因多样化水平水平也很高,而ABCT位点就落在这个区域的起始位置上,再次验证了作者fd统计方法的可靠性。
此外作者还发现一些特别有趣的现象,在这个基因区域内有野生小麦和驯化小麦之间的遗传分化指数是升高的,并且它还覆盖到了一个驯化选择的区域上。
(26)在ABCT位点附近,就存在两个驯化基因BTR1-A和BTR1-B,这和之前研究者们在玉米中认为的驯化基因会限制基因流的涌入的结论相反的。但是在5A染色体上发现的驯化基因Q周围又没有检测到基因渗入的信号。那么在小麦中基因渗入和驯化基因究竟是怎样的关系呢?。
(27)现在我们已经知道了野生小麦和现代小麦之间确实存在着基因流,那它在现代小麦中的分布有没有什么特点呢? 于是作者就将FI>100定义为基因渗入区域(是ABCT处的FI值),并以此为标准在landracss和cultivars中分别检测到了11.8%和11.4%的区域。再一次证明了,landracss从野生小麦那里获得了较高水平的基因流。
此外作者还发现在不同染色体上,基因流的占比和来源也不是不同的。明显的在1A, 4A, 4B, 5A和6A中具有更高的比例。既然基因渗入的分配不是随机的,那就说明基因渗入对于小麦进化是有着非常重要的意义的。
(28)小麦从发源地向世界各地传播的过程中,一定是需要对新的环境不断选择和适应的,那么基因渗入在此过程中是否具有贡献呢?
作者首先使用了Bayenv程序的环境关联方法,并结合余气候相关的SNPs分析,定位到了4万多个与环境适应相关的基因区域,长度达到988Mb。
然后又通过XP-CLR统计,将九个大的cultivars与参考landracss比较,定位到了四千多个至少在一个群体中经历过自然选择的基因区域,长度达到了2.3Gb,表明自然选择对基因组(17Gb)的影响更大。
然后将他们与基因渗入区域共同分析,发现20.4%的IGRs与自然选择的基因区域重叠。8.0%的区域与环境适应的相关基因重叠,这三大力量共同覆盖的基因区域到达到了81Mb,并对这一区域进行GO富集分析,发现确实从中找到了一些与品种改良和环境适应等生物进程相关的关键基因。因此可以推断说,基因流可能在进化过程中确实有助于小麦在新环境的适应和自然选择。
(29)此前就有文献报道,有害基因的积累会影响植物复杂形状的表达。那么这三大力量是否对有害基因的消除有一定的作用呢?
于是作者就先在之前鉴定到的区域中看一下SNP的分布情况。从4a中可以看出,在AB基因组中,sSNP的分布相似,而dSNP的分布显著不同,这可以解释为是进化过程中对有害SNP的自然选择造成的。此外我们也可以看到,D基因组中dSNP与AB都不同,作者认为这可能是在小麦多倍化造成的基因瓶颈,对D基因组选择低效造成的。
从bc图中我们可以看到,尽管B拥有更高的dSNP绝对值,但是在A中dSNP/sSNP更高,作者认为这可能与A染色体受驯化选择的范围更大有关,因为有文献报道说驯化会增加dSNP的数量。
(30)然后作者将cultivars和landracss中dSNP的数量进行对比,发现landracss中的dSNP数量都要更高,这很好理解,就是育种家在育种过程中会将含有影响作物产量的有害基因的品种选择掉。此外作者发现,不同的生物气候变量、自然选择选择的力度、基因渗入都是减少dSNP的数量的重要因素。
(31)那么这三大力量对小麦一些重要的农艺性状是否也有影响呢?
首先作者定位到一些小麦生产过程中重要的农艺性状的SNP,其中大部分定位到了定位到了自然选择、环境适应性区域中,有6.4%定位在了基因渗入区域中,说明了环境适应性和自然选择的确对小麦的性状有着非常大影响。
然后结合GWAS结果分析,发现在基因渗入的区域上这些基因的多样性低,因此作者猜测基因流可能有助于提高性状的遗传力。
然后作者又用方差分量分析的方法进行评估,可以看到,随着新生型等位基因频率的增加,来源于野生型小麦的基因流的SNP位点是在减少的,而且WEP基因集中在新生型基因频率<0.1处,也就是说,WEP基因更稳定,基因流有助于提高它们的遗传力。
【展望】
(32)以上呢,就是这篇文章的主要内容。简单来说,本篇文章通过对890多个现代小麦品种进行重测序,构建了一个庞大的外显子重测序数据库,并定义了现代小麦中基因渗入的区域。通过对这些区域的一系列分析,作者认为
①小麦中的基因流可以增加基因组的遗传多样性、降低遗传分化,一定程度上抵消了小麦在进化过程对基因组多样性造成的遗传瓶颈。
②基因渗入的范围和强度在不同基因组和染色体上的分布是不同的。
③基因流、环境适应和自然选择都可以有效减少小麦中dSNPs的负担。
④基因流有助于现代小麦中一些重要农艺形状的稳定遗传,并且扩大了其对环境的适应潜力。
这些发现对于小麦的育种具有重大的意义。比如说,育种家们可以参考基因渗入区域,更有针对性地制定育种方案,可以导入新的基因,扩大性状多样性,也可以减少小麦基因组中的一些有害基因,进而加速育种的进程。
(33)但是呢,本文中仍有一些科学问题还有待进一步探索。
①从图中作者认为地缘邻近有助于基因流的发生,从而减少基因间的分化,而且这一作用要大于品种改良的贡献,但是已经证明了在landracss中基因渗入的强度更高,但是其分化指数却依然比cultivars高,因此究竟基因流和品种改良哪个对基因分化作用更大?
②作者发现基因渗入的来源于不同的祖先,并且在现代小麦中也分布在不同的染色体上,那么小麦在进化过程中是如何决定基因渗入的来源和目标的?
③玉米中已经报道了驯化基因会抑制基因的渗入,而在小麦中却发现在驯化基因周围仍然存在基因渗入的信号,这是为什么?以及在小麦中基因渗入和驯化之间的关系究竟是怎样的?
④因为我了解到我国好像是没有发现野生小麦的,但是在现代品种中依然检测到了基因渗入的信号,那么这些基因渗入是什么时候发生的?是在进化过程中呢还是育种过程中导致的呢?
这就是我的一些想法,其实此外还是有一些检验方法和图不是特别的理解,下来还是需再进一步的讨论和知识储备,在这就不拿出来说了,以上就是我这篇文献讲解的全部内容,感谢大家的聆听。
【问题】
① 图1c怎么看?
② f3检验不懂,Z指数
③ f3和Fst关于LR和CL的结论是反的,究竟是品种改良作用大还是基因流
④ 2e、f图为什么不是反着画?
⑤ 图4a怎么看?
⑥ 为什么要dSNP/sSNP?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-5 17:08
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社