luria的个人博客分享 http://blog.sciencenet.cn/u/luria

博文

通过vcf格式的SNP位点信息找到其对应的rs号

已有 1715 次阅读 2021-1-6 18:42 |个人分类:BioIT|系统分类:科研笔记


例如通过GATK检测到某个样本chr23:31649149这个位点SNP信息如下。注:其中chr23chrX,这里是为了分析流程方便用chr23代替chrX

 

打开NCBIdbSNP检索页面https://www.ncbi.nlm.nih.gov/snp/,注意一定要在这个页面下搜索,不能在NCBI主页面搜索!

在检索框中检索如下信息NC_000023.10:g.31649149A>G

 

对于NC_000023.10:g.31649149A>G这一串字符是的格式称为HGVS name,它的格式如下:

RefSeq number:seq type.SNP locationREF>ALT

 

以上格式中冒号点号和小于号是固定的,标色的几个部分依次讲解如下:

[1] NC_000023.10

它是hg19版本中chrXRefSeq number(accession number),如下

 

如果不知道hg19/GRCh37.p13的某条染色体对应的RefSeq number,可以在NCBIAssembly数据库中搜索GRCh37.p13,如下

搜索完,在页面可以看到RefSeq号,如果用的参考序列是最新的GRCh38.p13,也可以用相同的方法获取到RefSeq

 

 

[2] g

g表示后面的位点来自基因组上,即The g. denotes that this is a variant described in genomic (i.e. chromosomal) coordinates;除此之外,还可以看到c,它表示cDNAp表示protein。更多解释,可以参见https://github.com/benjyw/hgvs

 

[3] 31649149

这个部分需结合seq type部分,例如,如果seq typeg则表示基因组上的位置31649149

 

[4] A

在本例中REF表示hg19NC_000023.10上的31649149位置是A

 

[5] G

在该样本中REF对应的位置发生了变异,由A变为G




http://blog.sciencenet.cn/blog-2970729-1265976.html

上一篇:使用Biopython解析Blast结果(二)
下一篇:Cytoscape3.8的安装

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-10-16 08:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部