chinesehugh的个人博客分享 http://blog.sciencenet.cn/u/chinesehugh

博文

[转载]动植物性状基因定位方法——BSA全基因组重测序

已有 2924 次阅读 2023-3-12 17:51 |系统分类:科研笔记|文章来源:转载

BSABulk Segregant Analysis

针对目标性状,选择表型极端差异的亲本构建家系,对该家系目标性状表型极端的子代分别混合得到的两个样本池进行全基因组重测序,检测到的两池间DNA差异片段即为候选区域,可进一步定位到目标性状相关的基因或标记。利用该方法,可以快速的对单一性状进行精细定位,加速目标性状的功能基因组研究进程。因此,BSA所研究的这个性状在亲本和子代中一定是极端差异,这样结果才能更准确。

1.png

BSA测序方案

样本要求:2个亲本+2个子代池(每个子代池≥20个样本)(200mg组织/样本)

文库类型:DNA文库(有参)

测序数据量:亲本10x/个,子代池≥20x/池(若子代池混样30个,就测30x

子代池选择:家系群体(F2RILSBCDH等)[杂交群体(Intercross2群体),重组自交系(Recombinant inbred linesRILs),回交群体(Back crossBC),双单倍体群体(Doubled HaploidDH)]

BSA影响因素

1)参考基因组:参考基因组组装质量好坏以及注释是否完全对BSA结果有一定的影响。建议尽量选择组装至染色体水平,且基因组注释较完全的参考基因组。

2)分离群体:理论上任何一对具有相对性状的亲本杂交后产生的分离后代都适用于集群分离分析法。但常用的分离群体为:F2代群体、回交群体、重组自交系、双单倍体群体(Doubled Haploid)

3)亲本选择:亲本间目标性状要求差异显著,尽量选用纯度高的亲本,并进一步通过自交进行纯化;并且,除了关注的1个目标性状外,其他性状尽量一致,无其他性状发生分离。

4)混池个体数:混池的样本数通常选取极端性状(群体总样本数的510%内)的个体进行混池。混池中若极端性状个体数太少,可能造成样品数不够,不具备代表性;若样本数过高可能会引入杂合个体,产生干扰。

5)表型统计:表型统计不准确,或表型由多个微效基因控制,可能会引起定位效果不佳。

2.png

BSA常见问题

1、群体完整度对定位效果的影响?

在BSA试验设计中,2亲本+2子代池是最优选择,次之为⼀个亲本+2个子代池;再次为2个亲本+1个子代池;1个亲本+1 子代池;最次为只有子代池,如果只有亲本,那么建议做变异检测。若是mutmap(突变体与野生型杂交),则可提供1个野生型亲本+1个突变型子代池,或者两个子代池。不同群体的index算法原理上稍有不同。

2、如果该物种没有参考基因组怎么办?或者如果样品是两个品种的杂交后代,而两个品种都有参考基因组,该选择哪个参考基因组?

如果该物种没有参考基因组,而近缘物种有参考基因组,可以选择近缘物种的参考基因组进行比对分析。如果两个品种都有参考基因组,则要根据样品的表型和其他数据选择⼀个与样品差异较小的品种作为参考基因组。

3、如何构建混池?混池规模多⼤能够满足要求?

通过表型调查,筛选具有极端表型的个体构建两个混池。表型统计不准确,或由多个微效基因控制,会影响定位效果。混池个体性状不极端,存在较多中间型,同样会导致定位结果不佳。⼀般选择群体的5%10%个体构建极端混池,建议极端样品在30+30以上。通常在样本量等情况允许的条件下越大越好,能够更进⼀步的缩小候选区域。具体需根据物种、样本情况等设计方案。

4、简化基因组测序适合做BSA性状定位吗?

针对微效多基因控制的数量性状,与目标性状相关的位点很多,简化基因组或许有幸捕获到少数位点,但绝大部分会被遗漏,这对后续的研究很不利。针对质量性状或由少数主效基因控制的数量性状,简化基因组BSA方法的风险更高。

5、能否保证定位到的候选区域的大小和候选基因的个数?

由于候选区域的大小或候选基因个数的多少与群体的大小、亲本材料差异的大小、目标性状特点、测序深度的多少、分析物种的基因组⽔平等多项因素相关,因此不能给出统一的标准,但可以参考已完成的项目经验进行估计。

6BSA能否检测SVCNV

不建议用BSA的结果检测SVCNV,第⼀,测序深度不够;第⼆,BSA⼦代是混池样本,混池样本做⼤结构变异检测误差较⼤,且没有分析意义;想做⼤结构变异检测,建议用新技术做,如Bionano、三代、10X Genomics或者测30X⼆代做分析。


BSA新方法- GradedPool-SeqGPS

该方法参考20197月发表在《自然-通讯》(Nature Communications)的Dissecting a heterotic gene through GradedPool-Seq mapping informs a rice-improvement strategy 的研究论文。

文中将F2群体不同表型均进行了混池测序,100-150个个体/池,个体平均测序深度0.5x,测序数据比对,变异检测,SNP标记筛选,统计检验-背景降噪-定位。这个降噪后分析结果看上去要比SNP-index的结果简单很多,精度也会高。如果样本足够,经费阔绰,建议可以用这个分析方法尝试一下。

3.png
4.png

三类BSA经典文献

一、常规BSA

QTL-seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations. The Plant journal, 2013.

利用BSA进行数量性状基因定位的方法由来已久,但是将高通量测序应用在BSA上则是近年来才出现的方法。这篇水稻的文章首次将高通量测序应用在BSA分析上,之后进行的常规BSA测序基本沿用该文献提供的方法。

使用两个性状差异较大的亲本AB构建遗传群体(如图示为水稻植株高矮性状,构建的F2群体),由于多个数量性状位点控制植株的高矮,该性状在F2群体中呈现正态分布。从群体中选取最高的多个植株和最矮的多个植株分别提取DNA组成“高”“矮”混池,并且将两个混池分别进行高通量测序。测序完成后将测序数据比对到A亲本水稻的参考基因组上,来进行SNP-Index的计算。

SNP-Index是基于高通量测序的BSA分析中最重要的概念,简而言之是位点上与某个亲本一致的reads占总reads的比例,可以看成子代混池中某种等位基因的频率。以下图为例,10reads覆盖了某一个核酸位点,该位点的测序深度是10。在这10reads当中,如果有4reads包含与参考基因组不同的碱基,则SNP-Index0.4;如果10reads均包含与参考序列不同的碱基,则SNP-Index1

将两个极端混池的SNP-Index相减得到ΔSNP-Index。通过滑窗计算染色体上各个区域的ΔSNP-Index,可以判断染色体上哪个区域最有可能包含目标位点。

5.jpg

此部分内容可参考陈程杰视频资料

BSAseq 数据分析在「TBtools」中点点点就搞定了~

https://www.bilibili.com/video/BV1yg4119774?vd_source=a84feb38f787daae65f893a0d3f32694


研究者利用这种方法进行了水稻抗稻瘟病的性状定位。使用较抗病的Nortai和易感病的Hitomebore两个品系作为亲本,构建了重组自交系群体(RIL)。对子代群体中的个体使用稻瘟病菌处理2周,选取较抗病和易感病个体分别构成混池,进行测序。对测序数据进行SNP-Index分析,发现在6号染色体上2.39-4.39 Mb的位置ΔSNP-Index最高,最有可能包含目标性状基因。

6.jpg

研究者还对水稻幼苗活力性状进行了定位。使用幼苗活力较高的Dunghan Shali和幼苗活力较低的Hitomebore品系杂交构建F2代分离群体,在种子吸胀后第14天测定幼苗高度,选取最高的多个个体与最矮的多个个体分别构建混池,并进行高通量测序。SNP-Index分析发现在3号染色体的36.21-37.31 Mb处和1号染色体的39.08-41.08 Mb处最可能包含目标性状位点。

7.jpg

 

二、Mutmap

Genome sequencing reveals agronomically important loci in rice using MutMap. Nature biotechnology, 2012.

MutmapBSA分析的一个重要变种,其基本原理也是通过构建分离群体,挑选极端性状构建混池,并通过计算SNP-Index来对目标性状位点进行定位。但是Mutmap可以针对经过化学诱变的个体进行性状定位,在对诱变得到的性状进行定位的时候更具优势。

将野生型植株使用甲磺酸乙酯(ethyl methanesulfonate, EMS)进行诱变,得到包含目的性状的突变株后与野生型亲本回交,得到F1后自交产生F2代分离群体。从F2代中挑选野生型与突变型性状个体分别构建混池进行高通量测序。测序完成之后,同样是与参考基因组进行比对,并计算SNP-Index

8.png

研究者利用建立的Mutmap方法对水稻叶片颜色性状进行了定位。以Hitomebore作为野生型使用EMS进行诱变,得到叶片颜色较浅的突变株Hit1917-pl1Hit0813-pl2,并将这两株与亲本回交后分别进行了Mutmap定位。SNP-Index计算的结果将目标性状分别定位到10号染色体和1号染色体上。其中10号染色体的位置包含一个疑似目标基因OsCAO1

9.png

研究者使用转基因方法进行了验证,分别往突变株Hit1917-pl1中转入了OsCAO1,往野生型植株中转入了敲低OsCAO1表达量的RNA干扰。往突变株Hit1917-pl1中转入OsCAO1得到的植株叶片颜色变深,野生型植株敲低OsCAO1表达量后叶片颜色变浅,验证了OsCAO1基因对水稻叶片颜色的调控作用。

10.png

三、BSR

Gene mapping via bulked segregant RNA-Seq (BSR-Seq). PloS one, 2012.

对于BSA分析来说,关注的突变位点更多地位于基因的编码区域,而且部分物种基因间区域包含大量重复序列,对测序和分析造成干扰。在这种情形下,使用RNA测序来进行BSR分析,不失为一个更好的选择。

BSR方法构建群体、选择混池的方式与常规的BSA方法并无二致,只是把测序对象从DNA更换成了RNA。研究者对玉米的gl3基因突变株进行了BSR分析,gl3基因会影响玉米叶片上蜡质的积累。研究者将gl3基因突变株与野生型作为亲本构建了F2代分离群体,从F2代中挑选极端性状构建了2个混池,并分别进行了RNA测序。将测序数据与参考基因组比对后进行SNP识别,并使用经典贝叶斯算法计算SNP与性状连锁的概率。最后将gl3基因定位到了4号染色体上一段长为2 Mb的位置上,并在该位置找到了gl3基因,该基因编码一个可能的myb转录因子。

11.png

12.png

 

作者提到,BSR分析方法在处理大基因组尤其是那些包含大量重复序列的基因组的时候会有优势。不仅减少了数据的冗余,也降低了测序成本。同时大量的RNA测序数据也可以通过表达量的变化来为候选基因的筛选提供相应的证据。但是值得注意的是,对于一些发生在调控区域的突变,BSR测序是无能为力的,可能存在与性状关联不上的风险。所以BSR虽然是一个很有力的研究工具,但使用的时候仍然需要谨慎。

转载自

1.简书 https://www.jianshu.com/p/59f70384251d

2.搜狐https://www.sohu.com/a/320602215_769248




https://blog.sciencenet.cn/blog-3431904-1380064.html

上一篇:蛋白质组学数据库的下载和利用
下一篇:[转载]核酸分子进化的标记——Ka/ks
收藏 IP: 112.36.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 03:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部