||
例如通过GATK检测到某个样本chr23:31649149这个位点SNP信息如下。注:其中chr23即chrX,这里是为了分析流程方便用chr23代替chrX
打开NCBI的dbSNP检索页面https://www.ncbi.nlm.nih.gov/snp/,注意一定要在这个页面下搜索,不能在NCBI主页面搜索!
在检索框中检索如下信息NC_000023.10:g.31649149A>G
对于NC_000023.10:g.31649149A>G这一串字符是的格式称为HGVS name,它的格式如下:
RefSeq number:seq type.SNP locationREF>ALT
以上格式中冒号点号和小于号是固定的,标色的几个部分依次讲解如下:
[1] NC_000023.10
它是hg19版本中chrX的RefSeq number(accession number),如下
如果不知道hg19/GRCh37.p13的某条染色体对应的RefSeq number,可以在NCBI的Assembly数据库中搜索GRCh37.p13,如下
搜索完,在页面可以看到RefSeq号,如果用的参考序列是最新的GRCh38.p13,也可以用相同的方法获取到RefSeq号
[2] g
g表示后面的位点来自基因组上,即The g. denotes that this is a variant described in genomic (i.e. chromosomal) coordinates;除此之外,还可以看到c,它表示cDNA;p表示protein。更多解释,可以参见https://github.com/benjyw/hgvs
[3] 31649149
这个部分需结合seq type部分,例如,如果seq type是g则表示基因组上的位置31649149
[4] A
在本例中REF表示hg19上NC_000023.10上的31649149位置是A
[5] G
在该样本中REF对应的位置发生了变异,由A变为G
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 17:24
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社