zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

生物网络融合方法:BIONIC

已有 1611 次阅读 2023-4-7 09:49 |个人分类:科普|系统分类:科普集锦

生物网络融合方法:BIONIC 

高通量功能基因组学项目产生了数千个基因的大量生物学数据,这些数据通常被表示为基因-基因相互作用网络,它们将相关功能的基因或蛋白质连接起来。这些功能交互网络具有不同的假阳性率和假阴性率,集成它们有望生成更准确和完整的功能网络。然而,实验方法的多样性使得统一这些信息成为一项重大挑战。 

现有的网络集成方法尚未解决这一问题。例如,许多集成算法生成的网络仅保留原始网络的全局拓扑特征,这可能以牺牲重要的局部关系为代价,而其他算法无法有效地集成部分不相交节点集的网络。一些方法在输出中包含了太多的噪声,例如使用更多维度来表示输出,这可能对基因功能和功能相互作用预测质量造成影响。大多数数据集成方法在网络数量或现实世界设置所需的网络规模上都无法扩展。传统的监督方法虽然非常成功,但它们需要标记的训练数据来优化对已知基因功能的预测,这可能是不可用的。此外,注释可能是有偏见的和有限的,已知功能描述有助于加强现有基因关系的理解,但不能够识别新的基因关系。 

为了解决有监督方法的潜在偏差,无监督生物网络集成方法最近被研究出来。从理论上讲,无监督网络集成方法可以提供许多理想的特征,如自动保留高质量的基因关系和去除虚假的基因关系。根据许多网络的共享拓扑特征推断出新的基因关系,并输出涵盖与输入数据相关的整个信息空间的综合结果,同时保持对生物功能的不确定性。然而,实际上,无监督方法仍然面临着挑战,例如可伸缩性。最近,新的无监督数据表示方法已经开发出来,重点是学习网络上的紧凑特征。但是,这种方法产生的通用节点特性对于感兴趣的任务来说不一定是最优的。随着图卷积网络(GCN)的发展,深度学习的进步已经解决了这一缺点。GCN是一类通用的神经网络架构,能够以可扩展的方式在网络上学习特征。与通用节点特征学习方法相比,GCN对于一系列通用网络任务的性能有了显著提高。 

在这里,Forster等人提出了一个通用的、可扩展的深度学习框架:BIONIC(使用卷积的生物网络集成,图1),用于网络集成。给定许多不同的输入网络,BIONIC使用GCN为每个基因学习一个单一的、统一的特征向量。BIONIC解决了上述现有集成方法的局限性,并产生了准确反映底层网络拓扑并捕获功能信息的集成结果。为了演示BIONIC的使用,作者们集成了三个不同的、高质量的基因和蛋白质相互作用网络,以获得集成的基因特征,并将其与一系列功能预测基准进行比较。实验结果表明,在网络数量和网络大小缩放方面,BIONIC保持基因特征质量的同时,在捕获功能信息和微度方面表现良好。当BIONIC应用于化学-遗传相互作用的分析时,也能够预测以前未被表征的生物活性化合物的细胞靶点。

image.png

1 BIONIC算法概述 

BIONIC是一种深度学习算法,它扩展了GCN架构来集成生物网络。与其他无监督方法相比,BIONIC产生的基因特征可以很好地捕捉功能信息,这是由一系列基准和评估标准决定的。BIONIC可以以半监督的方式使用标记数据,甚至可以完全无监督。与已建立的无监督方法相比,BIONIC可扩展到更多的输入网络和网络大小。如果对生物网络集成感兴趣,可以使用一下BIONIChttps://github.com/bowang-lab/BIONIC)。 

参考文献

[1] Forster DT, Li SC, Yashiroda Y, Yoshimura M, Li Z, Isuhuaylas LAV, Itto-Nakama K, Yamanaka D, Ohya Y, Osada H, Wang B, Bader GD, Boone C. BIONIC: biological network integration using convolutions. Nat Methods. 2022 Oct;19(10):1250-1261. doi: 10.1038/s41592-022-01616-x. 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

 

image.png




https://blog.sciencenet.cn/blog-571917-1383266.html

上一篇:细菌必需非编码RNA资源:DBEncRNA
下一篇:单细胞数据预处理和质控分析工具:popsicleR
收藏 IP: 39.128.55.*| 热度|

1 李升伟

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-22 20:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部