mashengwei的个人博客分享 http://blog.sciencenet.cn/u/mashengwei

博文

小麦未知基因的快速克隆方法4—Mapping by sequencing 技术

已有 4514 次阅读 2017-12-14 15:24 |个人分类:文献推荐|系统分类:论文交流| 小麦, 图位克隆, 株高

小麦未知基因的快速克隆方法4—Mapping by sequencing 技术

作者:麦萌

按照惯例,开始前要叨叨一点日常。最近没想到我们异常火爆,受到很多朋友的关注,陆陆续续的有不少老师和同学留言鼓励我们。目前我们的主编之一建辉同志去开了一次会,没想到很多朋友都特认可,杨足君老师更是极力推荐,目前关注人数也即将达到2000人。受到大家的认可,我们一方面感到高兴,另外一方面感到一定的压力,因为这种持续的输出我们不知道能坚持多久。

现在的研究手段和方法多样,数据也需要的越来越多,稍不注意就会落后。所以只有中国小麦人联合起来,才能一起铸造中国小麦的国际竞争力。鉴于此,我们建立了一个小麦联盟教师群。从事小麦研究的老师或博后可以申请加入,加入方法见文末。我们希望提供一个高质量的与小麦研究有关的平台,促进各位老师围绕小麦组学、育种、生物信息学等方向交流、讨论、共享和合作。

目前我们常务主编大概有6位,除了延鹏同志没有露面之外,其他几位大家应该都比较熟悉了。另外我们还有几位特邀编辑,不定期更新,等他们更新时我们会一并介绍。有机会我们会邀请一些老师来给我们做分享,所以如果您收到我们的邀请还请不要拒绝呢。当然,也可以直接联系我们(加微信“wheatgenome”)。

最后再次感谢诸位同仁的支持和鼓励,特别是给我们打赏的那几位朋友,有机会一定会当面致谢。胖丫在旁边说,拿着去打酒,请大家喝酒


今天给大家分享一篇利用外显子捕捉测序快速定位矮杆基因的文章,文章题目是 "Mapping causal mutations by exome sequencing in a wheat TILLING population: a tall mutant case study" 发表在Molecular Genetics and Genomics杂志上(doi.org/10.1007/s00438-017-1401-6)

突变群体中的目标基因可以通过正向遗传学的方法进行快速有效地鉴定,但利用传统正向遗传学的方法对目标区间进行定位往往周期比较长,同时繁琐地步骤也降低了定位效率。全基因组测序作图(mapping by whole genome sequencing)将目标区间的定位及突变位点的鉴定合二为一,提高了目标基因的鉴定效率。尽管高质量的基因组草图加速了目标区间定位及多态性位点鉴定,但由于基因组巨大(17Gb),小麦全基因重测序的成本依旧高昂。本文中,作者利用外显子捕捉技术(exome capture)来降低测序成本,并结合一个分离群体,对小麦4BS染色体上的一个矮杆基因区域进行了鉴定。研究结果表明,在高杆突变体后代中大约存在一个1.9Mb的缺失,该缺失区间包含9个基因,其中之一为Rht-B1基因。前人的报道表明,Rht-B1对株高的影响非常明显,应该就是造成突变体植株增高的原因。该快速定位目标基因的方法(mapping by sequencing)将大大加速小麦目标突变位点的鉴定效率,同时作者也对影响该方法的因素,比如测序深度和混池大小等,进行了讨论。注意,本文的突变是一段缺失,其实EMS突变是有几率引起染色体片段缺失的


T4-3822是四倍体小麦Kronos EMS诱变M2代的一个单株,该单株的M3后代中出现了矮杆的突变表型,将该行植株(来自于T4-3822)混收并播种后,对75个M4代植株进行表型鉴定,确定了该高杆表型受单基因控制。利用24个株高最矮和24个株高最高的M4植株,作者进行了单独建库和外显子捕捉测序,平均测序深度为53X(基于119Mb的外显子组)。经过分析之后发现,T4-3822 M2单株含有1847个高可信SNP,其中1247个SNP为杂合状态。在48个M4单株中,有25个SNP与株高相关(14个SNP均位于4BS的某一区间中,其余11个SNP散布于4个不同染色体上),其中位于4BS上的3个SNP与株高显著相关。尽管初步的SNP位点分析并没有找到候选基因,但4BS上SNP位点所在区域与株高之间的紧密连锁关系说明该区域与目标基因相距不远。通过分析中国春中的注释信息,作者发现著名的矮杆基因Rht-B1正好位于这个区间,很有可能就是目标基因。通过PCR扩增实验,作者发现所有的高杆株系均存在Rht-B1基因的缺失。因此,可以推论在这个群体中植株变高是由于Rht-B1基因的缺失造成的。Rht-B1基因的检测标记及结果参见下图:

                           

为了进一步验证Rht-B1基因的缺失以及缺失区间的大小,作者又将该基因附近的外显子捕捉测序数据比对到中国春参考序列上,发现在17个M4高杆植株中确实存在一个大约1.9Mb的缺失,该缺失区间包含Rht-B1基因,在23个矮杆姊妹系或8个半高杆植株(杂合)中却对应很多测序read。相关结果见下图:


前面我们提过所有的单株都是独立建库测序的,因此可以将数据混合之后模拟BSA分析(分离群体分组分析法,即若干个矮杆单株数据混合成一个突变体混池,剩余若干个高杆单株数据混合成野生型混池,再进行分析),用来检测BSA方法的效率。当分别将24个矮杆单株和24个高杆单株的测序结果混合之后再进行数据分析,得到了与单株独立分析类似的结果:同样可以将目标基因定位到4BS染色体上较小的区间。但如果混池中出现了污染,比如混入了目标区间杂合的单株,可能会对分析结果带来不利的影响。当混池单株数目降到11以下时,即小于11个矮杆单株和小于11个高杆单株进行混合,分析结果出现了偏差。当然,这样的结论仅对本文中的实验数据有效,我们在实际混池的时候还是应该尽量多混一些单株,小编建议每个池都要大于50个单株,最少也得30个单株,同时要严格鉴定表型,防止混入错误的样本。另外,当测序数据低于80X的时候(相对于外显子组捕捉数据),假阳性SNP位点开始增加;当测序数据为20X时,尽管假阳性很高,最终的分析结果也能够关联到4BS上的目标区间。由于基因组不同位置的外显子捕捉效率存在差别,为了得到一个更加可信的结果,作者也建议外显子捕捉的测序深度应该大于80X。


通过重测序进行进行目标基因的定位和克隆应该是一种非常有效的正向遗传学方法,更高质量的基因组参考图谱也为这一方法提供了便利。对于小麦来讲,重测序最大的挑战还是在基因组巨大上。本文利用外显子捕捉测序的方法可以只关注不到整个基因组1%的基因区域序列,排除小麦基因组大于85%的重复序列,从而可以大大降低测序数据量。当然外显子捕捉测序也有其缺点,其一就是目标区间并不在编码区,比如启动子区域或大的内含子区域,这种情况下就很难直接通过捕捉而测到候选突变位点。另外据小编了解,罗氏的小麦和大麦外显子捕捉芯片(也就是文章中用的芯片)价格可不便宜,并且是48个芯片起订(每个芯片貌似可以混4个样本),算起来也有小几十万。想做少量样本的外显子捕捉测序花费也不会太低。


另外还有一篇类似的文章“Mapping-by-sequencing in complex polyploid genomes using genic sequence capture: a case study to map yellow rust resistance in hexaploid wheat”,是关于抗条锈基因Yr6定位的,感兴趣的可以自行下载。


想要加入教师群的老师或博后,请扫描下方二维码,加我们的小萌萌为好友,审核通过之后,再拉进群。



欢迎关注“小麦生信联盟,了解小麦新进展




https://blog.sciencenet.cn/blog-1094241-1089641.html

上一篇:控制小麦的干旱胁迫响应过程中根部形态和蒸腾效率的关键基因
下一篇:VRN1的多重效应---兼论分子育种
收藏 IP: 58.213.93.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 09:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部