||
DrugRepoBank:药物重新定位综合平台
药物重新定位,也称为药物新用途或药物新任务,是一种旨在确定现有药物的新治疗应用的战略方法。这种创新方法揭示了已经被批准、停药、放弃或处于实验阶段的药物的新潜力。与耗时、昂贵和高风险的传统药物发现过程相比,药物重新定位为解决这些挑战提供了一种新途径,从而彻底改变了药物开发格局。它直接解决了传统药物发现项目中由于安全性和毒性问题而导致的约45%的高失败率。此外,它有可能将药物开发时间平均缩短5-7年。据估计,美国食品和药物管理局(FDA)批准的药物中约有30%是重新定位药物。一些来自药物重新定位方法的最成功和最知名的药物是西地那非、米诺地尔、阿司匹林、丙戊酸、甲氨蝶呤等。例如,西地那非最初用于治疗高血压和心绞痛,成功地重新定位治疗勃起功能障碍。药物重新定位在药物创新中起着关键作用,因为它能够加快药物开发,最大限度地降低成本和减少失败的可能性。它绕过了药物发现的初始阶段,利用现有的药代动力学、毒理学和临床安全性数据,可以将努力转向治疗传染病、难以治疗的疾病和被忽视的疾病。这一战略转变不仅使现有化合物恢复活力,而且还加速了为更广泛的健康状况寻找有效治疗方法的道路。
最近,出现了几个数据库,旨在探索药物重新定位的潜力。2006年发表的CMap包含超过100万个与各种扰动相关的基因表达特征。这些特征可以用来阐明药物、基因和疾病之间的关系。通过比较CMap中由疾病引起的差异表达特征与药物治疗特征,可以得出CMap评分来对这些关系进行排名。这些联系可作为制定与疾病治疗有关的假设基础。然而,CMap有其局限性,包括缺乏药物扰动数据、药物覆盖范围有限、剂量依赖性条件以及将细胞系或动物模型表达模式应用于人体系统的不确定性。2010年推出的Promiscuous是一个广泛的数据集,包括大约25000种药物、6500个靶点、大约21500个药物靶点相互作用和大约1100个副作用的信息。该数据库采用基于相似性和基于网络的方法进行药物重新定位,并已证明其在识别潜在候选药物方面的实用性。然而,Promiscuous包含相对有限的数据量,其预测算法的准确性需要进一步验证。DrugSig资源于2017年推出,涉及将疾病基因表达特征与已知药物的特征进行比较,以进行药物重新定位。目前,DrugSig仅包含1300种药物和6000多个标签。但是,数据库的功能和方法在某种程度上是有限的。有必要将额外的基因功能分析工具和其他计算药物再利用方法集成到DrugSig中,以增强其用户交互性。RepoDB于2017年推出,是一个收录已获批和未获批药物及其相应适应症的数据库。然而,它缺乏额外的信息或功能。这个限制阻碍了用户执行进一步的分析。RepurposeDB于2018年发布,提供了药物重新定位案例的全面收集和分析,组装了成功重新定位的药物,并提出了一套基于药理学、生物学和疾病特异性的药物重新定位原则。尽管如此,RepurposeDB缺乏目标预测功能和交互式可视化模块。它也有一个相对有限的数据集,包括大约250种药物和300个靶点。EK-DRD于2019年推出,是一个汇集药物重新定位实验知识信息的数据库。然而,它完全依赖于与药物相关的信息,例如已知的靶点或描述该药物重新定位研究领域的科学文章。此外,它不进行预测分析(如相似性搜索或相似分析),使其功能不适用于新导出的结构。2020年推出的Promiscuous 2.0代表了Promiscuous的升级版,其特征是数据量大幅增加。它包括将化合物计数扩大到100万,药物靶标相互作用显著增加到2,727,520。它还引入了疾病数据,并结合了通过基于相似性和基于机器学习的方法预测目标的能力。然而,值得注意的是,相似性和机器学习方法依赖于化合物结构特征,而忽略了其他因素,如目标蛋白和查询药物的相关途径,这可能会影响预测准确性。基于集成网络的LINCS 2.0于2020年发布,通过利用许多模型系统和分析类型的各种扰动集合,提供了21,231个扰动响应特征的综合目录。虽然LINCS提供了比CMap更多的标签数据,但其算法的准确性和速度仍有改进的空间。NeDRex于2021年推出,是一个综合性互动平台,旨在基于网络的药物再利用和疾病模块的发现。它整合了来自十个来源的数据,包括基因、药物、药物靶点、疾病注释及其相互关系。NeDRex能够构建异构生物网络,探索疾病模块和针对疾病机制的药物优先级,并包括统计验证过程。然而,NeDRex使用的基于网络的算法具有特定的局限性,例如假阳性蛋白质-蛋白质相互作用(PPI),由于研究不足和过度研究基因而产生的潜在文献偏差,以及集成数据库中药物-蛋白质关联可能无法区分激活和抑制的局限性。DrugSimDB于2021年推出,它提供了药物和靶点的全面信息,同时整合了多种基于相似度的药物重新定位方法,以提高其相似度方法的可信度。然而,DrugSimDB所使用的相似度算法还有进一步优化的空间,例如纳入更广泛的药物相关信息,以适应更广泛的药物类别或蛋白质。 DREIMT于2021年推出,整合了4690种药物共识谱和2600多种免疫基因表达谱,以建立药物与免疫谱之间的关联。然而,DREIMT目前在其范围上受到限制,主要集中在将现有药物重新用于免疫调节性疾病,这限制了其在其他医疗条件下的应用。PharmOmics于2022年推出,是一个物种和组织特异性数据库,包含来自大鼠、人类和小鼠的13530个转录组数据集,跨越20多个组织,涵盖941种药物。目前,PharmOmics采用的网络算法受到预定义的组织特异性调节网络范围的限制。
综上所述,尽管存在大量的药物重定位数据库,但其中仍然存在一些问题,包括数据量不足,数据类型有限,由于缺乏对多维或异构数据的考虑而导致算法不准确,缺乏对药物重定位相关文献数据的系统整理,分析能力有限,以及用户网页界面不友好。这些反复出现的问题突出表明迫切需要在这一领域建立一个综合平台。
为此,Huang等人提出了DrugRepoBank(图1,https://awi.cuhk.edu.cn/DrugRepoBank),这是一个新颖而全面的药物重新定位存储和发现平台。DrugRepoBank的显著特征及其相对于以往数据库的明显优势:
它汇集了来自多个高质量数据库的大量异构数据,包括药物、靶标、疾病、副作用和通路。
它包括经过实验验证的药物重新定位信息。利用最先进的方法,实现了多维算法,如7种相似度方法、3种人工智能方法、6种标签方法和2种网络方法,从而解决了现有计算模型的不足。
它使用户能够通过诸如药物-靶点-疾病副作用网络的可视化,疾病特征的通路分析等工具深入研究生物学意义。
它拥有高度用户友好的网络界面,便于无缝访问、搜索、过滤和导出功能,显著增强了用户体验。
考虑到药物重新定位在现代药物发现策略中日益突出的地位,DrugRepoBank数据库预计将对未来药物探索工作产生影响。
图1 DrugRepoBank特点。(A)从几个高质量数据库中整合了大量异构数据(药物、靶点、疾病、副作用和通路)。(B)从文献中收集的经过实验验证的药物重新定位信息。(C)多维度算法包括7种相似度方法、6种标签方法、2种网络方法和3种人工智能方法。(D)探索生物学意义的综合功能包括药物-靶点-疾病副作用网络的可视化、疾病特征的通路分析等。(E)用户友好的web界面使数据库易于访问、搜索、过滤和导出
总之,DrugRepoBank对药物重新定位领域的迫切需求做出了开创性的回答,克服了现有数据库中常见的数据可用性不足、算法不准确、文献整合不足和用户界面不友好等普遍挑战。DrugRepoBank通过整合来自高质量来源的大量不同数据,结合人工提取、实验验证的重新定位案例,并部署先进的多维算法,提供了全面而创新的解决方案。它还提供了一套分析工具,可以在高度用户友好的界面中通过网络可视化和通路分析进行深入探索。
参考文献
[1] Huang Y, Dong D, Zhang W, et al. DrugRepoBank: a comprehensive database and discovery platform for accelerating drug repositioning. Database (Oxford). 2024;2024:baae051. doi:10.1093/database/baae051
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 16:07
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社