||
尽管 Sanger 测序软件包仍广泛用于人类遗传病诊断和畜牧动物育种,但随着时间的推移,进展不大。使用传统软件通过手动视觉构象同时确定 Sanger 测序数据中数百至数千个样本中数十至数百个位点的基因型仍然耗时且容易出错。在这里,我们介绍了 SAGPEK,它可以从数百到数千个 ABI 格式的 Sanger 测序数据中自动识别目标基因座的基因型,并将基因型直接报告到输出文件中。SAGPEK 提取代表 A、G、C 和 T 碱基的信号强度,并进行碱基检出以确定每个位点的纯合子或杂合子状态。在此步骤中,SAGPEK 生成一个一级序列来记录具有最高信号强度的碱基,如果该位点是杂合子,则生成二级碱基。然后,SAGPEK 通过将软件中构建或用户提供的锚定序列映射到一级序列来获取目标基因座的坐标。最后,SAGPEK 报告了所研究靶基因座的基因型,也可以报告相应氨基酸的改变。SAGPEK 适用于人类遗传病筛查、耐药突变鉴定、畜牧动物功能突变检测等类似情况。
SAGPEK软件地址为:https://github.com/JINPENG-WANG/SAGPEK
如遇到使用问题,请联系SAGPEK开发负责人:
wangjinpeng0225@163.com
王金鹏 博士,副研究员
山东省农业科学院畜牧兽医研究所
研究方向: 奶牛基因组选择、重要功能基因挖掘
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 10:10
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社