||
TCMBank:最大中医数据库提供基于深度学习的中西医互斥预测
在中药现代化中,两个关键方面是确定中药中的有效成分和阐明有效成分与靶标之间的作用机制。构建一个全面、高可靠性的中医药数据库是非常可取的。
自2011年成立以来,TCM数据库利用自然语言处理,建立了知识图谱和分子信号通路,中医药数据库TCMBank(https://TCMBank.cn/),它包括9192种草药、61966种成分、15179个靶点和32529种疾病。更新后的TCMBank将草药成分的数量从32364种扩大到61966种(非重复),并增加了两个新的数据字段,即靶标和疾病。具有连接信息的草本植物数量为9010,草本植物的连接平均数量为16.05。具有连接信息的成分数量为54676种,草本植物的连接平均数量为5.26种。TCMBank以mol2格式提供草药成分的三维结构,并提供与外部公共数据库的交叉引用链接,如CAS、DrugBank、PubChem、MeSH、OMIM、DO、ETCM、 HERB等。目前,TCMBank是最全面的、可下载的和最大的非商业中医药数据库,TCMBank和其他TCM相关数据库之间的数据大小比较如图1a所示。TCMBank为用户提供了一个方便的网站,可以自由探索草药、成分、基因靶点和相关途径或疾病之间的关系(图1b)。图1c显示了建立TCMBank的过程,包括文本挖掘策略、智能文档识别模块等。所有与TCM相关的信息必须由志愿者手动验证至少两次,以确保TCMBbank数据的可靠性。
图1 最大中药数据库TCMBank的综合分析。a TCMBank与其他中医药相关数据库之间的数据大小比较,其中TCMBank在草药、成分和疾病方面最丰富。b TCMBank网站的组成,包括导航栏、主页、二级页面和三级页面。c TCMBank中数据处理框架和目标示意图。d用于药物官能团提取的基于图神经网络的自适应子结构感知模块示意图。e基于因果学习的中西医互斥预测。中医中药,WM西药,D-MPNN直接消息传递神经网络,3D-GNN三维图神经网络,MLP多层感知器,MMFF94默克分子力场,1994年版,CNN卷积神经网络
中西药物之间的不良反应可能导致医疗费用增加,甚至死亡。据估计,超过10%的患者需要同时服用五种药物,20%的老年患者至少需要同时服用十种药物,这大大增加了中西医相互排斥带来的医疗风险。中西药物互斥反应的鉴定在临床上主要依靠生化分析。然而,这一过程非常耗费人力和物力。
基于人工智能的中西医互斥预测需要大量的带有不良反应标签的中西医配对。中西药物缺乏互斥数据集,而目前有两个真实世界的公共药物相互作用(DDI)数据集:DrugBank和TWSIDES。TCMBank提供世界上最大的草药成分靶向疾病图谱信息。得益于TCMBank的大数据驱动,可以使用DDI模型来预测中西药物的相互排斥,以进行无监督学习。对于一对中西药,根据TCMBank查询中药中所含的活性成分。假设中药中的所有成分与西药没有不良反应,则确定它们之间不存在互斥反应。如果中药中的一种或多种成分与西药有不良反应,则它们具有互斥反应。通过这种方式,使用人工智能辅助的DDI预测模型来产生中西医相互排斥的预测结果。
人工智能辅助模型的预测结果尚未得到实际临床或生化测试的验证。未来,TCMBank将结合人工智能辅助的中西医互斥预测模型、NLP和文本挖掘中的知识图技术,开发一个综合的中西医结合数据库。将使用IDIM模块搜索人工智能辅助模型预测的中西医互斥反应,并下载、分析文献。知识图谱、关键词提取和自动摘要将用于帮助研究人员手动检查文献中包含的中西医互斥信息。
另一项有趣的未来研究将是预测一组多种(两种以上)中西药物的互斥反应。在现实世界中,患者显然摄入了两种以上的中西药。这将需要开发新的算法来考虑多种药物组合的相互排斥。基于药物化学知识,药物是由不同的官能团/化学亚结构组成的实体,这些官能团/化学子结构决定了药物的药代动力学、药效学特性和中西医的相互排斥。亚结构的相互作用被视为中西药物相互作用的因果关系,从而建立药物相互作用网络或多种药物之间的相互作用网络(图1d),其中化合物是节点,它们的因果关系是边。与TCM中的所有成分相对应的节点形成子网络。我们可以根据中医或西医对应的子网络之间是否存在边缘来预测它们是否存在互斥反应(图1e)。
作者们开发了TCMBank(https://TCMBank.cn/)汇集分散在各种来源的早期研究,创建一个全面可靠的中医信息系统。 TCMBank使人们能够研究草药的分子机制,并促进新药分子和相应潜在分子靶点的发现。TCMBank的优势包括:(1)TCMBank是目前最大的可下载和非商业数据库。(2)TCMBank通过不断更新智能文档识别模块,提供最新的中医相关信息。(3)TCMBank提供了大量的草药/成分信息,包括特性、理化特性和3D结构,以及其靶标/疾病信息。可以说,TCMBank能够满足人们对中医药现代化相关数据资源日益增长的需求,为未来中医药现代化的发展提供强有力的支持。
参考文献
[1] Lv Q, Chen G, He H, Yang Z, Zhao L, Zhang K, Chen CY. TCMBank-the largest TCM database provides deep learning-based Chinese-Western medicine exclusion prediction. Signal Transduct Target Ther. 2023 Mar 31;8(1):127. doi: 10.1038/s41392-023-01339-1.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2025-1-5 10:52
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社