xiaokeshengming的个人博客分享 http://blog.sciencenet.cn/u/xiaokeshengming

博文

郑捷团队运用遗传学大数据构建蛋白质与人类疾病的因果关系网络 精选

已有 4006 次阅读 2020-9-8 11:29 |个人分类:小柯生命|系统分类:论文交流

北京时间2020年9月7日晚23时,英国布里斯托大学综合流行病学研究所郑捷(Jie Zheng)助理教授团队与医药企业深度合作,在Nature Genetics《自然—遗传》上发表了题为“Phenome-wide Mendelian randomization mapping the influence of the plasma proteome on complex diseases”的论文。


该研究运用孟德尔随机化方法学,完整构建了1002种蛋白质与225种人类复杂疾病之间的因果关系网络。


通过此因果网络和现有药物随机双盲实验(randomised controlled trials;RCT)的比较,该研究证实蛋白质和人类疾病因果关系的推论能有效提高药物RCT的成功率,深度揭示了蛋白质组的遗传学研究方法在药物靶点早期筛查中的重要性。

  

蛋白质作为大多数药物的直接靶点(drug target),在药物研发中占有中心地位。医治人类疾病的大多数药物会通过改变人体内蛋白质的水平来调节人们的性状(如血压),最终达到降低人类疾病风险的效果。因此,构建蛋白质和人类疾病之间的因果关系,是药物研发的核心问题之一。

 

随机对照实验(RCT)是构建药物(蛋白质靶点)和疾病之间关系的黄金法则。但是其成本昂贵,耗时费力,失败率却居高不下。遗传学大数据和孟德尔随机化(Mendelian randomization)方法学的发展[1],使得大规模地搜寻蛋白质组和人类疾病之间的因果关系成为可能。


此类研究对寻找合适的药物靶点,增加随机对照实验的成功率,降低药物研发成本有非常重要的作用。然而,此类遗传学研究还处在“婴儿期”[2,3],需要大规模的实验来探索其可行性,并且需要制定相关研究标准来规范日后的研究。

 

在过去的数十年间,药物研发的投资不断推高,然而药物研发的成功率却不断下降。究其原因,超过50%的药物没有药效,25%的药物副作用过大;然而这些药物却都已经投入了昂贵的第三和第四期的随机对照试验。因此,有效的早期药物靶点的筛选系统对降低药物高企的成本有非常重要的作用。


人类遗传学因其研究对象为人类本身,因此在药物靶点的筛查中被寄予厚望。自从2006年全基因组关联分析问世至今,如何量化人类遗传学在药物研发中的价值,仍然是一份没有答案的考卷。

 

近期,遗传学领域的一些研究成果让系统性寻找药物靶点成为可能。其一,蛋白质组学(proteomics)的遗传学深入探索,让同时探索研究数千种蛋白质不再是梦想;其二,UK Biobank等大样本生物数据库使用权的开放,以及MR-Base、LD-Hub[4,5,6]等遗传大数据运用平台的建立,让同时研究数百种人类疾病成为可能。

 

郑捷团队在这些研究的基础上,系统性地运用孟德尔随机化,建立了1002种蛋白质和225种人类疾病之间的因果关系网络,还揭示了65种蛋白质和52种人类疾病的显著因果关系。


通过和现有药物随机对照试验的比对,发现有孟德尔随机化筛查证据支持的蛋白质靶点,其最终转化为上市药物的成功率有非常显著的提高。

 

该研究成果第一次证实并量化了蛋白质组的遗传学研究方法在药物靶点筛查上的三大优势:

1)快速有效地筛查药物对相关疾病的有效性(efficacy);

2)通过筛查该药物和其他疾病的关系,有效提示药物的相关副作用(adverse effect);

3)通过检索现有药物,探索现有药物对其他疾病的医治效果,发现旧药新用的可能性(reposition)。

 

在方法学的探索上,此项研究有两方面突破:

1)第一次系统行地阐述了连锁不平衡(linkage disequilibrium)对31.5%的孟德尔随机化结果会造成偏差,并进一步强调了共定位(genetic colocalization)等后续方法在此类研究中的重要性,为规范蛋白质组学的研究策略提供了参考;

2)为了有效增加共定位方法在多位点区域的可靠性,提出了Pair-wise conditional and colocalization analysis (PW-COCO)的改进方案,并运用该方法检测出23个之前未检测出的蛋白质和人类疾病之间的因果关系。

 

郑捷团队为了支持开放式的科研(open science)和帮助建立研究标准,公开发布了此项研究的分析方案(analysis protocol; https://github.com/MRCIEU/epigraphdb-pqtl)和超过22万对蛋白质--疾病因果关系的分析结果。


为了方便用户随时查找相关药物靶点和疾病的关系,该团队还建立了一个可视化数据平台EpiGraphDB(www.epigraphdb.org/pqtl/)。

 

图:图型化展示111对蛋白质和人类疾病之间的因果关系。涵盖心血管,癌症等8大类疾病。标注的PCSK9等蛋白质已作为药物投入实际治疗。

 

综上所述,这项成果是以成果转化为主导的遗传流行病前沿研究,从方法学上探索并规范了蛋白质组学的遗传学研究流程,为未来的跨学科研究打下坚实基础。由于和医药企业的深度合作,该研究也为医药企业的早期研发流程提供了全新的思路,跨出了遗传学成果转化的重要一步。

 

从结果看,这项研究第一次系统性地展示了蛋白质组的遗传学研究方法能有效提高药物研发的成功率,证实了其在药物靶点筛查上的重要性,并揭示了100多个新的药物靶点。为降低药物研发成本,进而降低药物的价格,造福人类健康提供了得力方法和途径。


据悉,本文作者中,布里斯托大学MRC综合流行病研究中心(MRC Integrative Epidemiology Unit)郑捷助理教授为该论文的第一作者兼通讯作者,其合作对象Robert A. Scott副教授和布里斯托大学的Tom Gaunt教授为该论文共同通讯作者。郑捷团队目前的研究方向为复杂疾病的统计遗传模型与因果关系推论在制药中的应用。

 

相关论文信息:

DOI:10.1038/s41588-020-0682-6

 

参考文献

1. Davey Smith, G. & Ebrahim, S. ‘Mendelian randomization’: can genetic epidemiology contribute to understanding environmental determinants of disease? Int J Epidemiol 32, 1–22 (2003).

2. Sun, B. B. et al. Genomic atlas of the human plasma proteome. Nature 558, 73–79 (2018).

3. Chong, M. et al. Novel Drug Targets for Ischemic Stroke Identified Through Mendelian Randomization Analysis of the Blood Proteome. Circulation (2019)

4. http://www.nealelab.is/uk-biobank

5. Hemani, G. et al. The MR-Base platform supports systematic causal inference across the human phenome. Elife 7, (2018).

6. Zheng J, et al. LD Hub: a centralized database and web interface to perform LD score regression that maximizes the potential of summary level GWAS data for SNP heritability and genetic correlation analysis. Bioinformatics, Volume 33, Issue 2, Pages 272–279 (2017)




http://blog.sciencenet.cn/blog-3423233-1249715.html

上一篇:江南大学陈坚/刘龙团队实现基于双功能基因回路的细胞中心代谢网络重构
下一篇:南京农大董双林团队发现小菜蛾利用植物“防御物质”识别寄主植物的分子机制

1 黄永义

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2020-10-23 09:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部