MengnanWang的个人博客分享 http://blog.sciencenet.cn/u/MengnanWang

博文

基因组功能注释

已有 4206 次阅读 2021-6-10 22:48 |系统分类:科研笔记

        我们在通过基因组从头预测后,获得gff3文件。在gff3文件中,我们可看到组装的contig或scafford上的基因结构。从gff3文件中,我们无法得到基因的功能信息。此时,我们需要对已知结构的基因进行功能注释。

        功能注释,即通过核酸或蛋白序列的比对,获得我们组装的参考基因组的基因功能。我们可以在NCBI或uniport等数据库下载核酸或蛋白序列,通过linux的文本处理,将gff3文件中的蛋白序列提取出来,形成新的fasta文件。使用blast软件,将下载的蛋白数据库建立索引,然后对fasta与蛋白数据库进行blast,得到基因的功能信息(得到结构基因的ID号)。获得基因的ID号之后,我们便可以对基因组进行GO或KEGG富集分析。为后续的比较基因组学研究做准备。



https://blog.sciencenet.cn/blog-3478320-1290653.html

上一篇:conda安装生信软件
下一篇:艺术的起源
收藏 IP: 120.203.222.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-18 22:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部