||
PTC:识别miRNA-mRNA在生物过程中的相互作用
确定表征生物过程的microRNAs (miRNAs)和信使RNA (mRNA)之间的调控关系是一项至关重要的任务。例如,Gregory等发现miR-200c在上皮到间充质转化(Epithelial to Mesenchymal Transition, EMT)过程中调控ZEB1,这是癌症转移的关键过程,因此miR-200c及其与ZEB1的相互作用可用于癌症转移的治疗。了解表征不同生物过程的miRNA-mRNA相互作用将有助于深入了解疾病的生物学,并有助于设计疾病的治疗方法。
已经开发了大量的计算方法来从数据中发现miRNA-mRNA的关系。第一波方法研究了miRNA和mRNA表达水平的负相关,因为大多数miRNA下调其靶mRNA。第二波方法论证了miRNA和mRNA之间的因果关系,旨在排除从数据中发现的miRNA与其目标mRNA之间的虚假关系。第三波也是当前的研究集中在miRNA和mRNA与其他类型分子的关系上,例如长链非编码RNA。这一类的一个例子是miRNA海绵相互作用网络,研究人员研究了不同RNA(包括mRNA、lncRNA和伪基因)之间的竞争,以争夺与miRNA结合的位置。
目前发现miRNA-mRNA相互作用的大多数计算方法都使用在生物过程的一个特定快照中产生的数据,而忽略了生物过程的动力学或时间方面。例如,几部作品旨在通过分析从癌性肿瘤中获得的基因表达数据来发现miRNA-mRNA相互作用。在这些工作中,所采用的数据是从不同患者在其疾病期间的一个单一时间点收集的。其他作品在两个不同的时间点或条件下使用基因表达等遗传信息,以对比不同生物状态下的发现,例如癌症与正常、上皮细胞与间充质细胞。
然而,理想情况下,我们希望了解在生物过程中发生了什么,例如,在细胞从正常阶段转变为侵袭阶段的过程中,基因如何相互作用。在生物过程中收集的时间序列数据可用于推断表征该过程的miRNA-mRNA相互作用,但在实践中很少进行这种动态分析。给定一个感兴趣的生物学过程,人们需要在该过程的不同时间点收集miRNA和mRNA的表达数据。由于实验的成本,这样的数据集很少。 因此,我们必须求助于其他类型的数据,并开发新的方法来检查生物过程中miRNA-mRNA的相互作用。
单细胞测序和伪时间概念的最新发展为开发揭示生物过程中发生的事情的新方法打开了大门。单细胞测序技术量化了单个细胞中转录本的基因表达谱。同时,伪时间方法利用生物过程标记物的表达(来自横断面数据)来排序细胞沿着生物过程的进展。广泛的研究表明,这种顺序本质上是暂时的,反映了生物过程的进展。
受伪时间概念的启发,Cifuentes-Bernal等人开发了一种新的方法,称为基于伪时间因果关系(PTC,图1)的方法。PTC通过使用基因表达数据以及相同细胞或样本中匹配miRNA和mRNA的表达谱来阐明生物过程中miRNA-mRNA的相互作用。给定一个生物过程,PTC首先利用该生物过程的标记基因将匹配的miRNA和mRNA单细胞基因表达数据转化为伪时间数据。PTC依赖于因果不变性从伪时间数据中发现miRNA和mRNA之间的因果关系。将PTC应用于单细胞数据集和批量数据。在这两种情况下,都使用EMT标记物VIM来定义伪时间。
图1 PTC方法。PTC包括三个阶段:(1)伪时间分析。处理miRNA-mRNA静态基因表达以创建遵循伪时间顺序的时间序列数据。选择VIM作为生物标记物来创建伪时间。(2)基因选择。使用MAD和TargetScan 7.0(保守位点预测)来确定一组miRNA作为k个基因的合理预测因子。(3) miRNA-mRNA调控关系的鉴定。评估对不变性的违反,以找到每个基因的因果亲本(预测因子)
结果表明,PTC在使用单细胞或大量数据识别实验证实的miRNA-mRNA相互作用方面显着优于基准方法。结果表明,生物过程中的时间信息有助于揭示表征生物过程的miRNA-mRNA相互作用。
参考文献
[1] Cifuentes-Bernal AM, Pham VV, Li X, Liu L, Li J, Le TD. A pseudotemporal causality approach to identifying miRNA-mRNA interactions during biological processes. Bioinformatics. 2021 May 5;37(6):807-814. doi: 10.1093/bioinformatics/btaa899.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 14:25
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社