||
调控非编码RNA:一切皆有可能,但重要的是什么?
哺乳动物基因组编码数以千计的非编码RNA(ncRNA),其中约有20,000个带注释的长ncRNA (lncRNA)基因,这一数字与人类基因组中蛋白质编码基因的总数相当,并可能最终超过人类基因组中蛋白质编码基因的总数。然而,大多数ncRNA在功能上仍未被表征,它们所扮演的生物学角色的多样性也在很大程度上未被探索。确定哪些蛋白质与ncRNA相互作用可以提供对其可能功能和机制的关键见解,从而形成实验可验证的假设。例如,将各种蛋白质相互作用映射到ncRNA已经导致提出的模型,其中特定的ncRNA可以:(1)将调节蛋白引导到特定的基因组DNA位点;(2)将多种蛋白质组分连接成大分子复合物;(3)介导和稳定三维染色质环;(4)激活或抑制特定的酶功能;(5)使蛋白质远离它们的mRNA或基因组DNA目标。
在过去的十年中,全球以RNA为中心的蛋白质组学方法(图1a)的发展,如RBR-ID (RNA结合区蛋白质组学鉴定)和RBDmap,使人们能够前所未有地探索哪些蛋白质与RNA结合。这些努力极大地扩大了已鉴定的RBP的数量,目前有超过4000种人类蛋白质(约占人类蛋白质组的20%)被UniProt注释为“RNA结合”。这些RBP包括许多缺乏标准RNA结合结构域的RBP,如RRM (RNA识别基元)或KH (hnRNP K同源)结构域,并包含关键的染色质和转录调节因子、核结构蛋白和代谢酶。大量推测的RBP代表了如此多样化的功能谱,这表明ncRNA的调节功能具有巨大的潜力。
图1 RNA-蛋白相互作用的鉴定和功能表征。a,左:使用紫外交联绘制RNA-蛋白质相互作用的方法,包括:(i)以蛋白质为中心的方法,其中选择性纯化特定蛋白质,并使用高通量测序绘制其相关RNA;(ii)以RNA为中心的方法,选择性地纯化特定的RNA或一组RNA,并通过质谱法鉴定结合的蛋白质。右图:解剖RNA-蛋白质相互作用的功能相关性的实验框架,通过抑制转录的ncRNA -蛋白质复合物来说明。通过以下途径破坏RNA -蛋白质相互作用的方法示意图:(i)删除RNA上的蛋白质结合区域;或(ii)蛋白质上的RNA结合区缺失;(iii)通过将效应蛋白合成地拴在RNA上来挽救表型。b,支持(绿色勾号)或反对(红色叉号)Xist与SPEN(左)或PRC2(右)之间功能相互作用的实验证据。c,一系列RNA介导的细胞过程调控的作用,包括三维DNA结构的介导,转录因子(TF)到基因组位点的募集,代谢途径的反馈抑制,以及蛋白质和RNA的亚细胞区室化
尽管如此,仍不清楚这些RBP中有多少与ncRNA相互作用,以及它们可能与哪些特定的ncRNA相关联。通常,定义蛋白质在体内结合的RNA需要以蛋白质为中心的方法,如CLIP(交联和免疫沉淀)(图1a)。当与高通量测序配对时,CLIP可以全面定义与感兴趣蛋白质相互作用的RNA上的特定位点。这种方法利用紫外线(UV)光在蛋白质与其结合的RNA之间产生共价光交联,而不是在蛋白质对之间。因为这些交联可以在活细胞中形成,特定的蛋白质可以在严格的洗涤条件下被纯化——通常是通过抗体——这种洗涤条件会破坏非交联的RNA-蛋白质和蛋白质-蛋白质的相互作用。然而,由于CLIP一次只能绘制一个蛋白质,因此探索数千个注释的RBP在技术上具有挑战性。此外,CLIP依赖于高质量的抗体,这些抗体并不总是可用的,特别是对于非规范的RBP。因此,将大多数这些蛋白质映射到特定RNA的努力有限。此外,即使在已经确定特定非规范RBP和RNA之间相互作用的情况下,这些相互作用的功能相关性也受到质疑。
一个来自Xist和PRC2的警示故事
Xist lncRNA代表了一个有价值的案例研究,说明了破译ncRNA-蛋白质相互作用和功能的一些实际挑战。简而言之,Xist是启动X染色体全染色体转录沉默以平衡雄性(XY)和雌性(XX)哺乳动物之间基因表达所必需的。虽然Xist于1991年首次被发现,但直到2015年才发现启动全染色体沉默所需的分子成分。
在此期间,对Xist的广泛表征表明:(1)Xist包覆非活性X26;(2) Xist足以启动X27上的转录沉默;(2) Xist的启动对应于PRC2及其相关的H3K27me3抑制标记在失活的X28上的积累;(3)Xist的A-repeat区域是转录沉默所必需的;(4) Xist的A-repeat与PRC2相互作用。由于已知PRC2在其他情况下参与转录沉默,这导致了Xist通过A-repeat直接与PRC2结合以沉默转录的模型(图1b)。
虽然这个模型似乎解释了这些观察结果,但存在一个问题:PRC2的缺失并不影响Xist介导的转录沉默(图1b)。由于Xist-PRC2相互作用是通过体外测量或天然RIP (RNA免疫沉淀)来鉴定的,它们可能代表溶液内的关联,而不是体内发生的真正相互作用。在一个经典的实验中,Mili和Steitz展示了天然免疫沉淀方法可以鉴定在活体中不可能发生的RNA-蛋白相互作用。同样,哺乳动物PRC2被证明与细菌RNA相互作用,其亲和力与其他哺乳动物RNA(包括A-repeat)相当。
事实上,据报道,PRC2可以与几乎所有RNA混杂结合,其生物学意义仍然是一个有争议的话题。虽然大多数RNA与PRC2相互作用的研究依赖于体外测量和RIP,但最近有人尝试使用CLIP12绘制PRC2;这些研究报告了PRC2与RNA(包括Xist)混杂结合的进一步证据。然而,尽管实验严格,这些研究强调了与CLIP数据分析相关的另一个关键问题。有充分的证据表明,与RNA相关联的reads数量与其总体丰度成正比,因此简单地识别reads并不能表明结合。由于这个原因,不可能区分一个蛋白质与所有RNA的混杂结合和不与任何RNA结合。此外,由于UV交联的低效率和CLIP的严格性,底层测序文库的复杂性往往极低,导致特定位置的读取堆积PCR重复。事实上,在CLIP实验中,许多报道的PRC2和特定RNA区域之间的相互作用似乎是PCR重复,而不是真正结合事件的富集。
与Xist-PCR2关联可能不代表体内结合事件的观点一致,一些研究使用不同的体内交联策略结合高强度洗涤和质谱法纯化了Xist。这些方法都没有发现Xist和任何先前报道的PRC2组件之间的关联。相比之下,这些研究都独立鉴定了SPEN(也称为SHARP),一种转录共抑制因子。后续研究表明,在基于细胞的模型和早期发育中,SPEN是存在蛋白介导的转录沉默所必需的。SPEN已被证明通过CLIP结合到Xist的A-repeat区域,这与缺少A-repeat的Xist不能沉默转录的发现一致(图1b)。
重要的是,支持特异性RNA-蛋白相互作用的生化证据与证明这些相同的相互作用通常是功能所必需的遗传证据之间的差异并不局限于Xist和PRC2。例如,最近的证据表明PRC2在HOTAIR介导的基因沉默中是不可缺少的,尽管它最初被报道是通过RIP5与PRC2结合的。 同样,据报道,YY1转录调节因子与Xist结合,将RNA连接到染色质上,但无论是YY1蛋白的删除,还是从Xist (F-repeat)中删除报道的YY1结合位点,都不会影响Xist在染色质上的定位或Xist介导的转录沉默。与此一致的是,严格的Xist纯化和质谱分析未能确定YY1是Xist结合蛋白。
这些例子突出了与删除已识别的“结合位点”相关的实际问题,作为支持RNA-蛋白质相互作用的功能作用的证据(图1a)。具体来说,RNA上的一个结合位点的缺失可能会导致不同蛋白质的破坏(例如,SPEN而不是PRC2对A-repeat的破坏),从而导致表型效应。当破坏蛋白质的RNA结合区域时,可能会发生类似的问题,这可能会影响其整体结构和其他基本功能。例如,CTCF的RNA结合区域的缺失会影响染色质环的形成;然而,由于它与锌指基序(一种已知的DNA结合基序)重叠,目前尚不清楚所观察到的影响是否仅仅是由于RNA结合。由于这些潜在的问题,直接测试RNA-蛋白相互作用重要性的替代方法至关重要。一种方法是在破坏RNA结合区和/或蛋白质结合位点后,通过合成融合重建RNA-蛋白质相互作用,并测量这是否可以挽救预期的表型(图1a)。例如,将SPEN的RNA结合突变体直接连接到Xist上,可以挽救X39上的转录沉默(图1b)。
弥合发现和功能之间的差距
许多其他非规范RBP,如代谢酶(例如,ENO145)和各种染色质复合物,包括DNA甲基化酶(例如,DNMT110和TET215)、抑制性(例如,PRC146)和激活性(例如,WDR547)染色质修饰剂、转录因子(例如,SOX248)和三维DNA结构蛋白(例如,CTCF),已被报道与RNA结合。基于这些观察,染色质调节因子已成为ncRNA调节基因表达机制的核心参与者(图1c)。尽管由于ncRNA可以在细胞核中形成固有的高局部浓度,这是一个有吸引力的模型,但在大多数情况下,RNA结合在染色质调节中的功能重要性仍未得到验证。随着据报道与RNA结合的蛋白质数量不断增加,我们面临着ncRNA的潜力与它们所扮演的功能角色之间越来越大的鸿沟。
基于从上述例子中吸取的经验教训,Guo等人提出了一个全面的框架—包括新的实验方法—这将有助于弥合这一差距。该框架包括:(1)严格的实验方法来定义高置信度的RNA-蛋白质相互作用-包括用于RNA中心蛋白质组学发现和蛋白质中心RNA定位的高严格性和/或变性纯化;(2)可扩展的方法,可以表征大量假定的RBP,这将需要开发新的工具,利用CLIP的严格性和结合位点精度,但要大大提高吞吐量。此外,预计需要额外的亲和试剂或替代纯化策略来绘制目前通过现有抗体无法获得的蛋白质;(3)严谨的计算和统计识别有意义的RNA结合区域的方法,这些区域可以解释丰富度、复杂性和其他人工制品的来源;(4)活细胞中蛋白质和RNA结合亲和力和占用频率的定量测量—这些方法将通过建立定量标准来更精确地表征真正的结合事件,包括对潜在混杂RBP相互作用的准确测量;(5)通过有针对性地破坏相互作用和通过重建挽救RNA-蛋白质相互作用来精确表征RNA-蛋白质相互作用的功能。
有了这样一个可靠的框架,作者们期望能够定义ncRNA和蛋白质功能的类别,以充分了解ncRNA介导功能的规模和范围。这些信息将使我们能够探索RNA的内在特性,使其成为广泛和通用的分子调节剂。此外,它将允许我们开始解决更多的全球性问题,例如为什么人类蛋白质组的很大一部分已经进化到与RNA结合,以及为什么基因组编码如此多而不同的ncRNA物种。
参考文献
[1] Guo JK, Guttman M. Regulatory non-coding RNAs: everything is possible, but what is important? Nat Methods. 2022 Oct;19(10):1156-1159. doi: 10.1038/s41592-022-01629-6.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 22:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社