||
aBIOTECH | 李广存团队开发用于bin标记与基因组分型的BacPhase新方法
多倍化现象在原核和真核生物中广泛存在,这对基因组分型分析(即确定哪些遗传变异位于同一个单倍型上)及后续基因组组装带来独特挑战。该问题对主要农作物尤为关键,因为超过70%的农作物为多倍体,其中马铃薯、小麦、甘蔗等物种的多倍体基因组结构尤为复杂。这些作物中同源与部分同源染色体间的高度序列相似性阻碍了精确分型分析。尤其对于马铃薯这类同源多倍体作物,由于存在大量共享单倍型,其分型解析更具挑战性。当前基于家系或群体推断的方法常导致变异分型解析不完整,且需依赖辅助数据。尽管Hifiasm等工具在二倍体与异源多倍体分型分析方面取得进展,但仍需大量长读长测序数据,凸显了开发创新方法以解析复杂基因组的迫切需求。而bin标记作为染色体片段的DNA标签,也可用于构建遗传图谱并定位性状相关基因。
近日,中国农业科学院蔬菜花卉研究所李广存研究团队在aBIOTECH 发表了题为“BacPhase: Long-insert paired-end sequencing for bin marker construction and genome phasing”的研究论文。在该研究中,作者开发了BacPhase的创新性方法。
研究首先基于限制酶的选择会影响标记在染色体上的均匀性与间距,开发者选择了14种限制性酶在多种多倍体作物中进行测试。例如:六倍体甘薯(Ipomoea batatas)、六倍体小麦(Triticum aestivum)、三倍体香蕉(Musa acuminata)和四倍体紫花苜蓿(Medicago sativa)。通过对14种限制酶电子酶切检测,发现BstBI和ClaI内切酶在染色体上的酶切位点分布和产生片段的长度更加均匀一致,为多种作物筛选的最优酶(图1)。
图1. 多倍体作物基因组中通过不同限制性内切酶进行酶切获得的片段长度
其次,为获取细菌人工染色体末端序列,从马铃薯栽培种合作88号(C88)中提取基因组DNA,利用HindIII进行部分酶切,并将其连接至CopyControl pCC1细菌人工染色体克隆载体,构建含有插入序列的重组载体。随后使用BstBI/ClaI对重组载体进行酶切,通过电泳分离酶切产物并筛选大于8kb的片段。对这些片段进行自连接后,通过选择性PCR扩增获得目标插入片段的双末端序列扩增产物。最后在PacBio平台对双末端序列扩增产物进行测序(图2)。
图2. BacPhase构建流程
通过该流程,利用PacBio HiFi长读长测序获得的成对双端序列进行Mapping,可以跨越染色体的重复区域,在马铃薯中构建了39,484个高置信度、高分辨率的bin标记。与依赖染色质互作的Hi-C技术不同,BacPhase直接利用长片段基因组序列的成对末端序列及其多态性实现精确单倍型解析(图3)。在四倍体马铃薯品种C88中,BacPhase成功将59.58%的scaffold锚定至染色体,在不依赖物理图谱或Hi-C数据的情况下显著提升了序列连续性。该方法有望推动马铃薯、甘蔗、紫花苜蓿等多倍体作物的性状定位、基因组选择及育种进程。
图3. 标记的密度分布
本研究得到了蔬菜生物育种全国重点实验室、国家自然科学基金、中国农业科学院科技创新工程、山东省良种工程等资助。中国农业科学院蔬菜花卉研究所简银巧副研究员,山东农业科学院蔬菜所郭晓助理研究员,中国农业科学院蔬菜花卉研究所博士生尚阳阳为论文的共同第一作者,中国农业科学院蔬菜花卉研究所李广存研究员,山东农业科学院蔬菜所杨晓慧副研究员为论文的共同通讯作者。山东农业科学院蔬菜所的董道峰研究员和杨煜副研究员参与了该研究。
引用本文:Jian Y, Guo X, Shang Y, Yang Y, Dong D, Yang X, et al. BacPhase: Long-insert paired-end sequencing for bin marker construction and genome phasing. aBIOTECH 2025. https://doi.org/10.1016/j.abiote.2025.100012
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 19:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社