|
2018 年 11 月 22 日,瑞士、丹麦、西班牙、美国和德国研究者在 Nucleic Acids Research 杂志上在线发表了题为“STRING v11: protein–protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets”的论文,介绍了 STRING 数据库的第 11 个版本。
01
—
STRING 数据库
蛋白和它们的功能互作是细胞机制的支柱。在理解生物学现象时,蛋白之间的连接网络时需要考虑的。但目前“蛋白-蛋白”关联信息依然不完备,且表现出不同程度的注释分散度和可靠性。STRING 数据库的目的在于收集、评估及整合所有公用的“蛋白-蛋白”互作资源,并与计算机预测的结果互为补充。其目标在于成为一个综合的、专门的全球网络,涵盖直接的(物理上的)互作和间接的(功能上的)互作信息。
02
—
第 11 个版本
STRING 数据库的最新版本号为 11.0,其囊括的物种数量相比之前翻了一番还多,达到 5090 个。其最重要的新特性在于,支持上传整个基因组水平的数据集,可以让用户把数据集可视化为互作网络,以及对整个输入的数据做基因富集分析。对于富集分析,STRING 不仅整合了著名的分析系统,例如 Gene Ontology 和 KEGG,还提供了另外新的基于高通量文本挖掘的分类系统,及基于数据库本身的关联网络的层级聚类。
03
—
用法
STRING 数据的主页(网址为 https://string-db.org)如下图所示,其使用起来也比叫简单,输入基因名、基因序列即可搜索蛋白互作信息。
同样以拟南芥中的 PHYB 为例,搜索到的蛋白互作信息如下:
值得注意的是结果页面上的 “More” 和 "Less" 可以增加或减少互作网络的大小,其背后的机制在于增加或减小可信度的阈值。
参考资料:
Szklarczyk D, Gable AL, Lyon D, Junge A, Wyder S, Huerta-Cepas J, Simonovic M, Doncheva NT, Morris JH, Bork P, Jensen LJ, von Mering C. STRING v11: protein-protein assocition networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research, 2018, gky1131. https://doi.org/10.1093/nar/gky1131
STRING 数据库的网址. https://string-db.org
欢迎关注“植物基因组”微信公众号
搜索微信公众号“植物基因组”或“plant-genomes”关注
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 16:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社