ChengyangWang的个人博客分享 http://blog.sciencenet.cn/u/ChengyangWang

博文

再次把Cell爆文的思路、方法用到自己的课题上

已有 4200 次阅读 2018-4-25 13:53 |个人分类:生物信息|系统分类:科研笔记

 

本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome

作者:小丫  来源: 嘉因

文末有【彩蛋】

CNS上的一些文章就是测测序、分析分析,用钱砸出来的吗?没钱不行,可是光有钱就行吗?Data driven,PLOS ONE的赶脚;我们崇尚hypothesis driven。我的课题要做成hypothesis driven,不要data driven。真实世界哪分得那么清楚?


今天小丫跟大家分享一篇典型的data driven + hypothesis driven 逐步深入的文章,从机制到临床靶标。每一块内容拆分出来,都是一篇10分的paper。上周发表于Cell,这两篇预热贴《Cell的模式图画反,反,反了》,《RNA-seq居然能挖出这么多机制!给你的文章加5分》说的就是它:

Chen, H., Li, C., Peng, X., Zhou, Z., Weinstein, J.N., Liang, H. and Cancer Genome Atlas Research Network, 2018. A Pan-Cancer Analysis of Enhancer Expression in Nearly 9000 Patient Samples. Cell, 173(2), pp.386-399.




用别人的数据发自己的Science | 给你的文章加5分》一文用别人的ChIP-seq数据,发现MYC通过结合PD-L1的promoter调控抗肿瘤免疫应答。本文用TCGA的RNA-seq数据,找到了调控PD-L1的enhancer,揭示了PD-L1的远距离调控机制




思路

第一步,Data driven

TCGA产生了那么多癌症数据,如何有效利用?我对enhancer感兴趣,能用TCGA的RNA-seq数据找active enhancer吗?先总体看看这些数据适不适合分析enhancer expression(Figure 1),结果还不错。发现:跟对照相比,肿瘤组织有着更广泛的enhancer activation

enhancer expression是啥,跟RNA-seq有啥关系?你需要补习这篇《RNA-seq居然能挖出这么多机制!给你的文章加5分

Figure 1. Overview of Enhancer Expression in TCGA RNA-Seq Data


接下来整合其他高通量数据,看看能找到什么线索。TCGA除了RNA-seq以外,还有CNV和mutation数据,整合这些数据,发现:肿瘤组织enhancer的激活与肿瘤非倍性呈正相关,而与点突变无关或轻微负相关(Figure 2)。



Figure 2. Enhancer Expression Is Associated with Different Types of Genomic Aberration


第二步,hypothesis driven

Data driven发现了有趣的规律:肿瘤组织enhancer的激活与肿瘤非倍性呈正相关机制是什么呢?

提出假设:非整倍性导致染色质开放,从而导致enhancer激活(Figure 3A)。

怎样证实这个假设呢?

既然model里的关键点是染色质状态,那就要用到open和closed chromatin的marker,用ATAC-seq和H3K27ac的ChIP-seq数据标识open chromatin,用H3K9me2和H3K9me3标识closed chromatin。对比发现:open和closed染色质的双链突变率(DSB rate)和点突变率的确呈现相反趋势(Figure 3B)。进一步整合Hi-C数据,证实DNA-DNA interection多的区域 DSB密度高,enhancer密度也高 (Figure 3C),再次证实了假设模型(Figure 3E)。

open chromatin跟转录调控有什么关系?ATAC-seq、H3K27ac、H3K9me2和H3K9me3跟染色质状态有什么关系?你需要补习这篇《等我有钱了,我也这样研究一个基因》里的两个视频。




Figure 3. A ‘‘Chromatin-State’’-Centered Mechanistic Model for the Interplay among Enhancer Activation, SCNAs, and Point Mutations


第三步,深入挖掘机制

上面的“非整倍性-open chromatin-active enhancer”模型最后影响了哪些关键基因,从而在癌症发生发展中起决定性作用呢?要揭示enhancer的功能,就要跟enhancer调控的基因联系起来,从共表达模式入手可以找到enhancer的靶基因。

作者整合了enhancer和mRNA表达数据,找出co-expression的gene和enhancer。这些gene和enhancer可能通过以下三种方式产生co-expression效果(Figure 4A):

模型一:causal relationship,enhancer的激活导致基因差异表达;

模型二:reactive relationship,基因位于enhancer上游;

模型三:co-responsive relationship,基因和enhancer都受其他分子的影响。

作者重点关注模型一,因为模型一是直接调控机制。从两方面着手:

首先看调控,enhancer突变是否导致基因表达的变化(eQTL);

然后看结合,enhancer跟gene是否形成loop(Hi-C)(Figure 4B)。

找到了65个这样的interactions,包括49个enhancer和47个gene(Figure 4C),其中有22个已知的原癌基因和8个抑癌基因(Figure 4D),80%的gene-enhancer interaction是正调控。鉴定出的gene-enhancer调控有可能是癌症发展中的关键因素,有潜力成为候选靶标,用于临床治疗。接下来选其中两个enhancer,深入研究。

你也想通过分析转录因子结合和共表达,来挖转录调控关系?强烈推荐这个整合了ChIP-seq和RNA-seq数据的在线挖机制工具去TCGA看表型,来CistromeCancer挖机制




Figure 4. Systematic Identification of Causal Enhancer and Cancer-Gene Interactions


第四步,挖掘临床价值

作者选了两个enhancer,深挖其临床价值。

No.1 位于chr22的enhancer,简称它为enhancer 22SYK可能是它的靶基因。从三个方面着手挖掘enhancer 22的功能:

  1. 哪些转录因子结合在enhancer 22上?查看ENCODE的ChIP-seq数据,发现有大量的转录因子在这个enhancer上有结合信号,预示着这里是调控网络中的热点hub(Figure 5A),原理看这篇《他中了国自然,因为最后一周补了这张图》。

  2. enhancer 22的变异会影响基因表达吗?先看转录水平,查eQTL,发现有3个SYK的eQTL。这两个在线工具教你查eQTL《变异会影响转录?SNP影响转录因子结合?RegulomeDB》,《non-coding区的SNP影响了转录?HaploReg视频》(Figure 5BC)。再看蛋白质水平,查TCGA的蛋白表达数据,跟转录水平一致,enhancer activity跟SYK蛋白表达水平正相关(Figure 5DE)。

  3. enhancer 22的变异影响了患者的生存期吗?在很多癌症类型里,enhancer 22变异患者的预后都很差(Figure 5F-K)。这里有方法:《TCGA,她已经用了七年 | 资深用户深度点评

至此,挖掘出enhancer 22的临床价值:利用enhancer 22调控SYK的这一特点,把enhancer 22作为癌症诊断的分子marker。仅这一部分就是一项完整的研究,妥妥的10分paper。




Figure 5. Enhancer 22 as a Prognostic Marker across Cancer Types


No.2,位于PD-L1下游140kb处,简称enhancer 9。从以下五个方面挖掘其功能:

  1. 共表达分析:多种癌症类型中,以及130种肺癌细胞系中,enhancer 9与PD-L1有着强co-expression(Figure 6AB)。

  2. enhancer 9的变异引起PD-L1的表达变化吗?答案是肯定的(Figure 6C)。

  3. enhancer 9和PD-L1之间能形成loop吗?7种人细胞系的Hi-C数据证实,enhancer 9和PD-L1之间形成了DNA-DNA结合(Figure 6D)。

  4. 哪些转录因子结合在enhancer 9上?ENCODE的161种转录因子数据当中,只有NF-kB在enhancer 9上有结合信号,同时NF-kB在PD-L1的promoter上也有结合信号(Figure 6E),这再次证实了NF-kB介导了enhancer 9和PD-L1的远距离调控。

  5. 敲除实验证实enhancer对靶基因的调控。采用经典的研究单个enhancer对靶基因调控作用的实验,发现敲除了enhancer 9的细胞中,PD-L1的转录水平和蛋白表达确实降低(Figure 6F-H)。

至此,揭示了一个NF-kB介导PD-L1激活的enhancer-promoter相互作用模型。仅这一部分又是一篇10分paper。




Figure 6. Enhancer 9 Regulates PD-L1, a Key Target of Immunotherapy


最后,看看本文一共整合分析了这么多数据,文中都有链接




【彩蛋】

本文通讯作者梁晗,副教授,美国德州大学MD安德森癌症中心生物信息与计算生物系。



2015年,小丫参加了梁晗老师主讲的龙星课程,课程主题就是TCGA,http://210.46.85.200/dragonstar/,对课程ppt感兴趣的小伙伴可以联系嘉因表观小助手,微信号:epigenomics




想用ChIP-seqATAC-seq研究感兴趣的基因?想整合ChIP-seq、ATAC-seq、eCLIP/RIP-seq、RNA-seq数据寻找线索?找嘉因生物吧!从实验、测序,到多种数据整合分析,为您一站式解决。(点击文中蓝字了解详情)




嘉因公众号定位:客户共性问题解答,生信学习资源导航,高通量实验导购 | 为您提供高通量实验-测序-分析-验证一站式解决方案


130225t2nzqrppn22nna6k.jpg

电话:021-61539657

Email:marketing@rainbow-genome.com
地址:上海市杨浦区国伟路135号10号楼305室




https://blog.sciencenet.cn/blog-3372875-1110834.html

上一篇:这些年的讲座ppt都白攒了
下一篇:RNA-seq居然能挖出这么多机制!给你的文章加5分
收藏 IP: 124.77.56.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 04:02

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部