|||
一、
1、eggNOG注释原理
通过已知蛋白对未知序列进行功能注释;
通过查看指定的eggNOG编号对应的protein数目,存在及缺失,从而能推导特定的代谢途径是否存在;
每个eggNOG编号是一类蛋白,将query序列和比对上的eggNOG编号的proteins进行多序列比对,能确定保守位点,分析其进化关系。
2、访问在线工具,比对好的蛋白序列只需要eggNOG注释,在线工具即可满足,单个文件蛋白序列最高1M。
http://eggnogdb.embl.de/#/app/emapper
3、使用eggNOG数据库进行功能注释新基因、蛋白序列。常用于新基因组、转录组和宏基因组的基因集。直系同源(orthology)功能预测认为比传统的同源搜索更准确,可以避免直接从旁系同源(paralogs)借用功能注释(基因重复有很高的机会形成功能分化)。
4、[project_name].emapper.annotations文件,最终需要的文件
[project_name].emapper.annotations文件:比对结果整理,这才是重点。
This file provides final annotations of each query. Tab-delimited columns in the file are:
文件由制表符分隔为13列,如下:
1 序列名query_name: query sequence name
2 eggNOG编号seed_eggNOG_ortholog: best protein match in eggNOG
3 seed_ortholog_evalue: best protein match (e-value)
4 seed_ortholog_score: best protein match (bit-score)
5 预测基因名predicted_gene_name: Predicted gene name for query sequences
6 逗号分隔的GO注释GO_terms: Comma delimited list of predicted Gene Ontology terms
7 KO编号注释KEGG_KO: Comma delimited list of predicted KEGG KOs
8 代谢反应BiGG_Reactions: Comma delimited list of predicted BiGG metabolic reactions
9 注释物种范围Annotation_tax_scope: The taxonomic scope used to annotate this query sequence
10 OG编号Matching_OGs: Comma delimited list of matching eggNOG Orthologous Groups
11 best_OG|evalue|score: Best matching Orthologous Groups (only in HMM mode)
12 COG分类COG functional categories: COG functional category inferred from best matching OG
13 模型注释eggNOG_HMM_model_annotation: eggNOG functional description inferred from best matching OG
5、具体命令行直接参考 :刘老师 https://blog.csdn.net/woodcorpse/article/details/83144768
————————————————
版权声明:本文为CSDN博主「刘永鑫Adam」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/woodcorpse/article/details/83144768
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-13 16:46
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社