chinesehugh的个人博客分享 http://blog.sciencenet.cn/u/chinesehugh

博文

蛋白质组学数据库的下载和利用

已有 5628 次阅读 2023-2-28 18:10 |系统分类:科研笔记

在做蛋白质组学的分析过程中,数据库的下载是一个不能忽视的问题,如何下载数据库呢?

我们通常用到的数据库有两个,一个是uniprot,应用广泛;另一个是NCBIUniprot意为universal proteind,由Swiss-ProtTrEMBLPIR-PSD三大数据库集合而成,数据主要来自于基因组测序项目完成后,后续获得的蛋白质序列。它包含了大量来自文献的蛋白质生物学功能信息,也是目前蛋白质组学文章中使用最广泛的公共数据库。

以鸡(Gallus gallus)为例进行数据库下载。

Uniprot蛋白质组学数据库下载:

1.进入uniprot网站(https://www.uniprot.org/),点击Species

1.png

2.输入Gallus gallus,点击search,找到Reference proteomes,点击Entry ID

2.png

3.点击View proteins

3.png

4.点击Customize columns,增加Gene names(primary)和Gene ontology IDs两个选项,点击Save

4.png

5.png

 5.点击Download,在弹出对话框中根据需要选择TSV/EXCEL/FASTA格式,此处选择TSV格式(可用EXCEL打开)

6.png

7.png

模式物种或有基因组注释的物种可以用上述方法,无基因组注释的物种需要用蛋白序列进行比对,以预测其功能并进行注释,可以用EggNOG,参考视频教程https://www.bilibili.com/video/BV1wP411H7hi/?spm_id_from=autoNext&vd_source=65b306a2187a04d30391a223a23a1efa


NCBI蛋白质组学数据库下载:

1.进入NCBI首页(https://www.ncbi.nlm.nih.gov/),选择Taxonomy

6.png

2.输入Gallus gallus,点击search,弹出下框,点击protein

7.png

3.点击左边栏目中的RefSeq

8.png

4.Send to下拉菜单中选择保存格式,然后Create File,保存文件。

9.png

熟悉生信分析的同学当然知道如何利用,我这里仅介绍其中一个方法,即利用TBtools软件上的本地Blast工具进行比对,本部分内容参考软件开发者陈程杰老师的推文https://www.bilibili.com/read/cv13673278/

参考百度文库https://wenku.baidu.com/view/a2a84921a46e58fafab069dc5022aaea998f41de.html?_wkts_=1677579164430&bdQuery=%E8%9B%8B%E7%99%BD%E8%B4%A8%E7%BB%84%E5%AD%A6%E6%95%B0%E6%8D%AE%E5%BA%93%E7%9A%84%E4%B8%8B%E8%BD%BD




https://blog.sciencenet.cn/blog-3431904-1378353.html

上一篇:[转载]基因组分析中的“地图”——gff3和gtf文件
下一篇:[转载]动植物性状基因定位方法——BSA全基因组重测序
收藏 IP: 223.104.195.*| 热度|

1 梁洪泽

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 01:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部