chinesehugh的个人博客分享 http://blog.sciencenet.cn/u/chinesehugh

博文

NCBI是如何对基因和转录本编号的

已有 6222 次阅读 2023-2-25 16:49 |系统分类:科研笔记

NCBI上基因前面有个accession(编号)分别有NC、NM、NP、GI、XP、XM、BC、AB、NG、AJ、AC、AY和AF等等,然后后面是一串数字,比如:

1.jpg

ACCESSION是NCBI序列数据中我们常用到编号(另一个是GI)。ACCESSION形式为NN_#####.#,其中NN为两个字母,其不同组合又可以区分为蛋白序列、核酸序列或基因组序列,而#为位数不等的数字,.#代表版本号。这样ACCESSION就是一个唯一的表示,代表一个唯一的序列,而且这个编号不会改变。

具体的各项说明及序列来源说明可以查看NCBI(http://www.ncbi.nlm.nih.gov/refseq/about/)
2.jpg

一般来说,mRNA和基因组序列是我们主要的寻找对象。如果想找标准序列的话,mRNA就采用NM_开头的,基因组用NC_或者AC_开头的。

3.jpg

4.jpg

不同的编码代号代表不同的意思,如NM_开头的表示标准序列,XM_表示预测的蛋白编码序列,NR_表示非编码蛋白的mRNA序列,AF开头的表示克隆序列,BC开头的表示模板序列......

上面的表格中是一些常见序列的accession号,NCBI还有很多其他的accession号!其中,仅与RNA相关的就有116种!不过,科研人员生存不易,不必在细节上作死自己,建议大家按需选择或者需要时查询即可!

参考:

扫盲贴:NCBI上的这些字母都是些什么鬼https://mp.weixin.qq.com/s?__biz=MzA5ODQ1NDIyMQ==&mid=207101987&idx=1&sn=7cd0119c3fef56b03e314237fdf28a9e&chksm=193ddf812e4a5697dec08fce6859c9a9a753f9591620d3774d0ff77854d8917647546c2e77b5&scene=27

Gene ID或转录本快速查找方法https://www.ribobio.com/service-and-support/gene-id-search/



https://blog.sciencenet.cn/blog-3431904-1377901.html

上一篇:基因功能注释( GO / KEGG / PFAM)和富集分析
下一篇:[转载]基因组分析中的“地图”——gff3和gtf文件
收藏 IP: 112.36.94.*| 热度|

2 许培扬 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 15:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部