||
药物-疾病网络与药物再利用
药物再利用,即寻找现有药物的新用途,是药物开发领域的重要组成部分。药物再利用的一个基本部分过程是识别有潜力的候选药物,大量工作已投入到开发用于执行此任务的计算和统计方法中。关于药物再利用,研究者们使用网络科学这一新兴领域中的工具来处理这个问题,将其视为在药物及其治疗疾病组成的网络上的链接预测问题。
网络为许多具有复杂相互作用的系统提供了方便的数学表示方法,其中包括许多在药理学或更广泛的生物医学背景下具有重要意义的相互作用。例如,药物相互作用网络、药物及其靶点网络以及基因与所关联疾病网络。近年来,网络方法在医学和制药问题中得到了广泛的应用。
最近,Polanco 和Newman利用现有数据(包括机器可读和文本数据)、自然语言处理以及人工编辑和数据清洗相结合的方法,编制了一个广泛的药物与疾病治疗网络数据集。该网络包含 2620 种药物和 1669 种疾病。它与之前的药物-疾病数据集不同之处在于规模更大、更完整,并且完全基于明确的药物治疗-疾病关系,避免了使用从药物功能、靶点或结构等间接推断出的关联。
其次,作者们利用数据集应用网络方法来预测潜在的新治疗药物-疾病配对。该数据集以二分网络的形式存在,也称为关联网络,包含两种类型的节点,分别代表药物和疾病,且连接仅存在于不同类型的节点之间:药物节点与疾病节点之间的连接,或称为边,意味着该药物适用于治疗该疾病——参见图 1。利用该网络,通过链接预测识别药物重新定位的候选者。在各种网络中,一个普遍的发现是现有数据是不完整的,节点之间应该存在但实际不存在边的连接,这可能是由于测量误差或从未进行测量。链接预测是尝试识别这些缺失连接的过程,通常基于网络中观察到的模式或规律性。例如,在考察个体之间的友谊社交网络时,如果数据显示两个有很多共同朋友的人彼此并不认识,这会令人惊讶。因此,人们可能会假设数据不完整——这种联系确实存在,但某些原因导致它没有被记录下来。这是一个“缺失的边”。

图 1 这里考虑的药物和疾病的双边网络。网络中的节点有两种类型—药物和疾病—以及边仅连接不同类型的节点,以表示哪些药物适用于治疗哪些疾病。该网络被认为是不完整的,因此数据中缺少一些应该存在的边(虚线)。其目标是识别这些应该存在的边
已开发出多种用于识别缺失边的计算方法。最简单的方法不过是“有很多共同朋友”这一论点的形式化版本,但也有许多更复杂的方法。一种流行的方法集利用图表示学习方法,如非负矩阵分解、node2vec和 DeepWalk,这些方法构建网络的低维嵌入。另一种有前景的方法是利用拟合到输入数据的网络结构统计模型。在此背景下最常用的模型是度校正随机块模型,尽管也尝试过其他模型,如层次模型和非度校正模型。Musawi 等人对应用于生物网络的链接预测方法进行了全面综述。
基于这些研究,Polanco 和Newman选择了一系列链接预测算法,包括新方法和现有方法,并将它们应用于药物-疾病相互作用网络。作者们进行了广泛的交叉验证测试,以量化每个算法的性能,通过随机从网络中移除一小部分边,并测试算法识别哪些边被移除的能力。
主要发现:一部分算法在这个任务上表现良好,显示出令人印象深刻的能力,能够精准定位药物-疾病网络中的缺失边,这一点通过标准指标进行了量化。在考虑的所有方法中,最好的方法可以实现超过 0.95 的 ROC 曲线下面积,并且平均预测精度比随机猜测高出近千倍(尽管不使用同一算法)。此外,这种性能是通过纯网络方法实现的——除了网络本身,没有使用任何药理学输入。可以合理推测,结合基于网络的预测和药理学见解可能会进一步提高性能,因此方法可以单独使用,也可以作为混合预测策略的一部分。然而,作者们在这里的目标并不是创建这样的混合策略,而是专门测试链接预测作为一种工具的使用。作者们将这项工作视为一个概念验证,展示了在这种背景下通过链接预测可以实现的表现。
整篇论文,作者们首先讨论了基于网络的药物-疾病治疗相互作用预测方法的前期工作,然后介绍了自创的数据集并描述了用于构建它的方法(https://github.com/apolanco115/drug-dis-lp)。接着,描述了采用的二部网络链接预测算法,其中一些是先前发表的,而另一些是新的但与先前网络的方法相似。其次,介绍了交叉验证测试结果和算法性能的综合测量。此外,还报告了一些关于链接预测性能的正式结果,这些结果使我们能够对网络中缺失边的数量进行界定,从而告诉数据集的质量和潜在的药物重新定位机会数量。
参考文献
[1] Polanco A, Newman MEJ. Drug-disease networks and drug repurposing. PLoS Comput Biol. 2025;21(10):e1013595. https://doi.org/10.1371/journal.pcbi.1013595
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-12-5 18:27
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社