推送了这么多篇文献,今天斗胆推送一篇我们小编自己发表的一篇文章。最近刚刚发表在Theoretical and Applied Genetics上的题为“SNP‑based pool genotyping and haplotype analysis accelerate fine‑mapping of the wheat genomic region containing stripe rust resistance gene Yr26”。
在正式推送之前,简单说一下研究背景。本研究最初的遗传材料都是由南京农业大学陈佩度教授和曹爱忠教授所惠赠。在上世纪70 年代,刘大钧院士和陈佩度教授等利用四倍体圆锥小麦 γ80-1 与簇毛麦杂交,再将后代与六倍体普通小麦多次回交,并从中鉴定选育出小麦-簇毛麦 6VS/6AL 易位系。其亲本来源有“扬麦 5 号/4/γ80-1/簇毛麦//宁麦 6 号/3/扬麦 2 号”,该易位系包括 92R137、92R89、92R90、92R149 等种质,简称“92R 系列”。随后先后定位出位于 6VS 上的抗白粉基因 Pm21和位于1BL上的抗条锈基因Yr26。由于该易位系良好的抗性于上世纪 90 年代开始广泛应用在小麦育种中,育种家利用该易位系先后培育出内麦系列(8 号—11 号)、石麦 14、远中 175、扬麦 18 等十八个小麦抗病新品种。这些新品种累积推广面积超过六千万亩,为小麦累积增产 15 亿公斤。
Yr26 最初由马渐新(2001)等定位在 1B 染色体短臂上(1BS),并与 Xgwm11、Xgwm18 和 Xgwm413 连锁;而 王春梅等(2008)利用中国春小麦的细胞遗传学特殊材料(缺体、缺失系)将 Yr26 定位在 1B 染色体长臂上的 C-1BL6-0.32 区域,且开发出 Yr26 基因两翼标记最近为Xwe173(1.4cM)和 Xbarc181(6.7cM);后 张小娟等(2013)通过比较基因组学利用小麦 EST 序列信息与水稻、短柄草共线区域开发设计了许多更紧密连锁标记,绘制了较为精细的遗传图谱。
由于 Yr26 广泛的应用,导致条锈小种出现了变异,2008 年首次在四川发现 Yr26 毒性小种 V26,随后几年里 V26 小种频率持续上升,且在西北、西南等地区大量存在,已对我国小麦粮食生产构成威胁。但含有 Yr26 基因的品种广泛种植,短期内不可能全部淘汰,且 Yr26 对仍然处于流行地位的 CYR32 和 CYR33 依旧保持良好抗性。而克隆 Yr26 对于全面解析 R 基因与 Avr 基因互作的分子机制具有重要意义,最终为持久抗病育种提供理论基础。
在之前的图位克隆工作中,虽然绘制了 Yr26 较为精细的遗传图谱,但群体量(2341)对于六倍体小麦来讲还远远不够,且由于该基因位于着丝粒附近,其实际的物理距离非常大,不够满足筛选 BAC 文库进行物理作图的条件。但由于前期可供参考的序列信息有限,对于标记的开发止于比较基因组学层面,随着二代测序技术的成熟与小麦初步的基因组信息公布,促进了小麦基因定位与克隆的进展。如前文所述,已有大量学者利用BSR-Seq(国内主要刘志勇教授团队)和芯片技术开发与目标基因连锁的 SNP,并用于基因的遗传作图。因此,本研究利用BSR-Seq 和芯片技术开发了与 Yr26 相关联的 SNP,并利用这些 SNP 开发成 KASP分型标记进行大群体作图(超过30,000个配子体),结合中国春1.0版本的参考基因组对目标物理区间(约 500kb)进行了基因注释,并预测了部分候选基因。
1. 供试材料及遗传群体的构建及混池。本研究利用近等基因系材料创建了 NIL-S × NIL-R 的 F2 代大群体(本文中简称 NIL-SRF2)和 F6 代重组高代系1034 个(简称SRF6RILs)。利用前期定位所用的扬麦5号 × 92R137 的 F2:3 群体,通过单粒传(single seed descent)的方式繁殖出 273 个 F8 代 RILs(简称 YRF8RILs),同样利用单粒传繁育出 Avcet S × 92R137 的 F7RILs 共 156 个家系(简称 ARF7RILs)。如下图。
2. 基于芯片的DNA 混池分析。利用小麦 90K 和 660K 芯片分别对三个不同组合群体的抗感池进行全基因组扫描,然后将三个抗感池间表现多态性的 SNP 进行比较整合。从 90K 芯片扫描的结果统计三个抗感池间共同的多态性 SNP 有 332 个(图 2A),根据 90K 的高密度遗传整合图谱信息,发现有 252 个分布在 1B 上,约占 75.9%,另有 57 个未获得定位信息(图 2B)。而三个抗感池在 660K 芯片扫描结果中有 1988 个共同的多态性 SNP(图 2D),根据 660K 遗传图谱,发现 1745 个分布在 1B 上,约占 87.8%,另有 197 个未获得定位(图 2E)。将 1B 上的 SNP 两翼序列比对到小麦参考基因组 1.0 版本,获得其物理位置信息,对于某些 SNP 可能比对到基因组多个区域,以其错配(mismatch)碱基最少、比对片段最长、e-value 最小及得分(bitscore)最高的比对结果选为最佳。再统计每 Mb 中含有的差异 SNP 的数量,其中 90K 芯片在 300~329Mb区间 SNP 的密度最高(图 2C);660K 芯片在 297~343Mb 区间SNP 的密度最高(图 2F)。如下所示。
3. 基于转录组的RNA混池分析。比较抗感池间唯一比对的序列,进行 SNP 的挖掘,挖掘出的潜在 SNP 经过三轮标准的筛选:首先通过费舍尔精确检验(Fisher's exact test)SNP 变异显著性水平来判定其与目标性状是否关联,图 3A 为样本的 p-value 的频率分布统计,在超过 46 万个 SNP 中,只有 11208 个 SNP 与目标性状关联(p-value<0.01),说明通过该方法分析出的关联 SNP 假阳性低;然后针对多重假设检验的结果进行校正,即通过 q-value<0.01 进一步筛选出显著富集的关联 SNP 共 1672 个(图3B);再利用等位基因的比率(Allele ratio)公式计算出 Allele ratio≥0.9 的 SNP 共 602个(图 3C),最后根据基因组比对的结果,发现 530 个(88%)SNP 落在 1B 染色体上,且主要集中在 3 个区间,即 120Mb~195Mb、280Mb~349Mb 和 408Mb~488Mb(图3C)。而 Yr26 很有可能就在这三个区间中的某一个区间里。BSR-Seq 虽然成功的定位了 Yr26,但 SNP 在 1B 染色体上的跨度很大。为进一步缩小范围,本研究将之前部分用于定位 Yr26 的 SSR 和 EST-STS 标记的 PCR 产物序列与小麦基因组进行比对,获得其物理位置,并与遗传图谱进行比较发现,两者的共线性良好,如图 3C,红色标记为靠近着丝粒一侧,绿色标记为 1B 长臂远端一侧,根据 之前的研究结果,Yr26 位于 Xwe173 和 STS-BQ33 之间,结合SNP 芯片的定位结果,发现多态性 SNP 的密度在这个区间内也是最高(图2C&F),因此初步推断 Yr26 极有可能位于 300~350Mb 区间内,见图 3C 红色框线Ⅱ。如下图。
4. 目标区间确认及高密度遗传图谱构建。为了更进一步缩小 Yr26 基因的候选区间,我们进行了大规模重组交换株的筛选工作。前期利用 Xgwm11 和 Xwmc419 标记筛选了约 12000 个 NIL-SRF2 单株,共获得 500个重组交换株,然后使用 WRS414 和 CM1452 对这些交换群体继续筛选得到 19 个关键重组体。并将这些重组体进行接种 CYR32 鉴定,获得表型,后经春化移栽至温室获得F3 种子,并对 F3 再次接种鉴定获得 F3 表型。结合重组体对 CYR32 的表型和基因型数据,将 Yr26 锁定到 CM1461 和 WRS467之间,约 0.003cM 区间,物理距离约为 488kb。如下图。
5. 利用单倍型分析开发特异性标记。为了检验 Yr26 连锁的 KASP 标记的特异性,将涵盖Yr26区间的48个SNP标记在384 个自然群体中进行单倍型分析,聚类结果显示,Yr26 载体材料与其他基因载体材料能够被区分开,说明标记具有特异性,可以用来分子辅助选择。
虽然我们取得了一些进展,但由于Yr26特殊的位置,我们的目标区间在中国春的参考基因组上没有任何典型的NBS-LRR抗病基因,之所以认为Yr26可能是典型的R基因,主要是根据目前已经克隆的秆锈基因都是一些专化抗性基因,且无一例外的都具有NBS-LRR结构。目前我们正在筛选Yr26载体构建的BAC文库,搭建该区间的物理图谱,希望能取得理想的结果。