||
网络生物学的当前和未来方向
网络(或图)由一组节点(或顶点)组成,这些节点(或顶点)由一组边(或链接)连接。网络使我们能够研究复杂系统的特性,这些特性是由各个组成部分之间的相互作用产生的。网络已经成为表征各种现实世界现象的有力方式,包括技术、信息、交通、社会、金融、软件、生态、化学和生物系统。特别地,生物网络通过将给定的生物系统表示为一个相互关联的实体而不是单个组件的集合,在基因、蛋白质、细胞、组织、器官等水平上提供对复杂功能的理解。节点表示生物分子(例如,蛋白质内的氨基酸残基,细胞内的蛋白质或组织内的细胞),边缘表示生物分子之间的相互作用(例如,物理的,功能的或化学的)。
网络生物学(图1)是一个跨越计算(如算法、图论、网络科学、数据挖掘和机器学习)和生物科学的跨学科领域。虽然该领域已经存在了近二十年,但它已经发生了迅速的变化,并且出现了新的算法挑战。这是由许多因素造成的,包括不断增加的数据复杂性,例如在生物组织的不同级别(或规模)上可用的多种类型的数据,以及不断增长的数据大小。具有讽刺意味的是,尽管可用数据量大幅增加,但数据仍然不完整且有噪声。这意味着该领域的研究方向也需要不断发展。
图1 网络生物学领域的发展概况和五个研究课题。中间的词云是由WordClouds.com生成的,包含了本文中最具代表性的前30个词。请注意,每个词的排名是基于核心词(例如,learn)及其衍生词(例如,learned, learning, learned)的权重之和
为了促进对该领域未来的讨论,Milenković等人于2022年在圣母大学组织了一个关于网络生物学未来方向的研讨会。这次有针对性的会议汇集了39位网络生物学各个方面的活跃研究人员,介绍并讨论了该领域计算研究的短期和长期愿景。31名与会者亲自参加了讲习班。由于与COVID-19大流行相关的国际旅行困难,所有现场参与者都来自美国的机构。为了结合不同的想法和经验,作者们尽了一切可能来平衡与会者的多样性。也就是说,在面对面的与会者中,42%是女性。在学术参与者中有一个健康的等级组合(例如,正教授,副教授或助理教授,博士后和博士生),并且有来自行业和政府的代表。
与会者介绍了他们对重要研究方向、开放问题和挑战的看法,这些问题和挑战将推动网络生物学中计算特别是算法的进步。在YouTube上公开了演讲的视频记录,以及关于研讨会的其他信息网址。研讨会的目标之一是了解算法领域如何使网络生物学领域受益,反之亦然。此外,研讨会旨在确定网络生物学中已建立的以及新兴算法主题的紧迫挑战,如图1所示:生物网络的推理和比较(第2节)、多模态数据集成和异构网络(第3节)、高阶网络分析(第4节)、网络上的机器学习(第5节)和基于网络的个性化医疗(第6节)。作者们评论了为什么这些主题被战略性地选择在研讨会上讨论。
某些类型的组学数据被显式地捕获为网络。也就是说,作为数据收集的生物技术的结果,生物分子之间的相互作用被明确地提供。一个突出的例子是蛋白质-蛋白质相互作用(PPI)网络。在这些网络中,节点是蛋白质,边缘对应于蛋白质之间的物理结合。在人类和一些模式生物中,广泛的高通量酵母杂交和其他实验努力已经产生了大量的“参考”PPI(如人类的HURI),以及关于蛋白质结合特异性的大量知识。其他类型的组学数据没有被明确地捕获为网络,但生物分子之间的相互作用可以通过计算推断出来,例如,关联、相关性、调节或知识图。第2节讨论了推断同质网络任务的几个方面,包括条件特定网络,通常由几个组学数据类型/模式组成,以及差异网络(网络比较)分析的相关主题。第3节讨论了推断异构网络的任务,通常是从不同的组学或其他多模态数据类型,以及与多组学数据集成相关的其他几个任务,包括网络校准,这是另一种类型的网络比较。同质网络是指具有单一节点类型和单一边缘类型的网络,而异构网络是指任何非同质网络(即多个节点类型或多个边缘类型或两者兼而有之)。
给定(显式捕获或推断的)网络数据,下一步是分析数据。第2节和第3节已经从网络比较和其他几个任务的角度讨论了网络分析,第4节和第5节进一步讨论了与网络分析相关的突出任务。也就是说,第4节讨论了在传统使用的成对图中捕获称为子图的高阶网络结构的主题,它捕获节点对之间的交互,以及从成对图转向超图,它能够捕获两个以上节点之间的交互。第5节讨论了机器学习在网络生物学中的进展,这是一个在过去十年中呈指数级增长的领域。讨论的关键主题包括图表示学习、将知识整合到机器学习模型、生成图建模和迁移学习。
第6节通过讨论网络生物学的一个应用方面:基于网络的个性化(或精确)医学来补充其他以计算为重点的部分。精准医学旨在为个体提供量身定制的治疗策略。这种个性化的特征可能包括分子、环境、生活方式和其他因素。通过网络方法整合这些不同的数据类型可以扩大精确治疗的潜力,同时提供对各种类型数据噪声的鲁棒性。
这五个主题并不相互排斥。例如,多模态(包括多组学)数据集成是几乎与第2-6节所有内容相关的主题。在这五个部分中介绍了当前研究网络生物学的进展之后,第7节讨论了该领域未来的研究方向,第8节提供了关于计算(包括网络)生物学的科学社区、教育/培训和多样性的额外讨论。
详细内容见文献[1]。
参考文献
[1] Zitnik M, Li MM, Wells A, et al. Current and future directions in network biology. arXiv preprint arXiv:2309.08478, 2023.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-25 01:58
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社