phenome的个人博客分享 http://blog.sciencenet.cn/u/phenome

博文

DamoPa:医学预训练模型(老药新用、天然产物发现专题)

已有 2314 次阅读 2023-4-24 21:55 |个人分类:医学大模型|系统分类:科研笔记

一、概述

目前,最常用于表征疾病原因、药物作用机制的知识体系,主要由人类专家手工编辑形成的信号通路构成。DeepoMe(深度甲基)开发的DamoPa (Foundation Model for Medicine based on Pre-training),是希望用数据驱动的方式,在大规模数据集中计算得到与人类衰老、疾病病因与机制、药物作用相关的模型,形成预训练模型库。在应用中,基于本地数据(小规模数据集、甚至单个体的生物学测量),应用预训练模型,产生基于本地数据的副本,进而在本地数据上测试该模型与表型的相关性。或者生成基于内源性代谢物、营养素、药物的干预方案。这里节选了部分内容。关注DeepoMe深度甲基公众号,输入“白皮书”可以获取DamoPa技术白皮书全文。

二、技术架构

…(细节请参考技术白皮书原文)

三、应用场景

应用场景分为几个板块:营养需求分析与营养干预方案生成;药物重定位与天然产物药物开发;中医证候表征与计算。为了演示功能,本报告使用两个新冠感染的全基因组DNA甲基化数据集。其中“数据1”包括473个Covid-19阳性和101个阴性个体,全血样本采用illumina 850k芯片获得的数据,阳性病例按照WHO标准分为重症组(Severe) 和轻症组(Mild)。“数据2”包括164个阳性个体、296个阴性患者和65个其他呼吸道感染样本,全血样本采用illumina 850k芯片获得的数据。病例分为4个阶段:(1)从急诊室出院(家庭护理);(2)住院治疗;(3)ICU;(4)死亡。本演示是科学研究用途。

1 营养需求与干预方案生成

2 药物研发

2.1 “老药新用”

对已获批药物进行了SEMO分析,发现与新冠严重程度最相关的前四个SEMO特征与抗凝药肝素(Heparin)、消炎和广谱抗病毒药物吲哚美辛(Indomethacin)有关,如下图所示。

图片 13.png

图11 发现与疾病严重程度相关的药物

计算在前200个与表型最相关的SEMO特征中出现的PPI和药物的频次,如下图所示。频次越高的药物能调控的PPI越多。

图片 14.png

图12 各类药物在新冠严重程度相关的SEMO网络中的重要性排序

2.2 天然产物活性成分筛选

如下图所示,对天然产物成分进行SEMO分析,发现与新冠严重程度最相关的前四个SEMO特征分别是:CSF2-Parthenolide (小白菊内酯),CSF2-Andrographolide (穿心莲内酯),TLR2-Parthenolide和LCK-Leurosidine。Parthenolide (小白菊内酯)是热带菊的主要活性成分,通过抑制IL-6的产生具有抗炎作用,以及对SARS-CoV-2类蛋白酶的抑制活性。

图片 15.png

图13 发现与疾病严重程度相关的天然产物化合物

Andrographolide(穿心莲内酯)是广泛用于中药的穿心莲的主要活性化合物,具有抗炎作用,具有减少细胞因子风暴的潜力。提示这些化学物质可以通过调节CSF2和TLR2蛋白网络以调节细胞因子产生来影响病毒反应。

对高频出现的天然产物化合物进行排序,Parthenolide(小白菊内酯)位列第二,Andrographolide(穿心莲内酯)位列第三。如下图所示。

图片 16.png

图14 天然产物化合物在新冠严重程度相关性网络中的重要性排序

排名第4的是Ursodeoxycholic (熊去氧胆酸),是一种天然胆汁酸,最近因其调节ACE2途径而被报道对减少SARS-CoV-2感染有效、在预防方面也有潜在价值。本分析发现,CD4.n与Ursodeoxycholic acid熊去氧胆酸组成的SEMO特征、CD69.n与Ursodeoxycholic acid熊去氧胆酸组合形成的SEMO特征,在重症和轻症病例之间具有显着差异效应,其中T检验的P值分别为1.1E-17和4.3E-17。提示熊去氧胆酸可能靶向CD4+和CD69+细胞。

在疾病的不同阶段,天然产物化合物的重要性可能不一样。通过数据2的分析,从绿茶中提取的EGCG是第一阶段(新发感染)中排名第五的化合物,如下图所示。

图片 17.png

图15 天然产物化合物在第一阶段(新发感染)中的重要性排序

熊去氧胆酸Ursodeoxycholic在第二阶段(转住院治疗)中排名第二,如下图所示。

图片 18.png

图16 天然产物化合物在第二阶段(转住院治疗)中的重要性排序

3 中医证候量化表征与计算

...

参考资料:

DamoPa:现代医学与中医融合预训练模型

DamoPa模型:因果涌现,48例样本也可以发现生物标志物,中医的DNA甲基化特征优势明显



https://blog.sciencenet.cn/blog-508476-1385637.html

上一篇:DamoPa模型:因果涌现,48例样本也可以发现生物标志物,中医的DNA甲基化特征优势明显
下一篇:免疫衰老反转:更换T细胞和NK细胞可让人年轻多少岁?
收藏 IP: 221.221.166.*| 热度|

1 熊江辉

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 05:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部