||
coRmiT:疾病关联的miRNA靶基因预测
MicroRNAs (miRNAs)是一种约22 nt的小RNA序列,在许多生物系统中对mRNA表达的转录后抑制和调控具有重要作用。它们的研究对疾病很重要,因为它们显示出作为生物标志物和治疗靶点的潜力。转录组测序技术越来越多地应用于基因表达的各个方面。一个重要的方法是整合mRNA和miRNA的表达,以检测miRNA靶基因对(mTPs)。
寻找mTPs最简单的策略是分别分析mRNA和miRNA的表达,找到差异表达基因(DEGs)和差异表达miRNAs (DEMs),然后利用基于序列的预测方法确定哪些DEGs-DEMs对可能是mTPs。这些方法包括TargetScan、PITA、miRanda和miRDB。然而,在过去的8年里,只有TargetScan和miRDB得到了持续的更新,与高通量验证数据集相比,最近发布的预测工具的精度仍然很低。近年来,基于深度学习的新工具不断涌现,如DMISO、TargetNet、miRBind、ncRNAInter等。
miRNA表达水平与其靶标之间的反相关性也提供了潜在调控的证据。许多研究利用这一思路来寻找mTPs。然而,在不同的研究中,这种通用方法的实施存在相当大的差异。有人直接计算了所有miRNA与mRNA表达谱之间的Pearson相关系数。其他研究人员首先使用加权基因相关网络分析(weighted gene correlation network analysis, WGCNA)将mRNA分组为共表达模块,然后使用模块特征基因代表基因模块,计算共表达基因与单个miRNA表达谱之间的相关系数。在其他研究中,他们将miRNA和mRNA分别分组为共表达模块,并计算其模块特征基因之间的相关系数。此外,也有研究使用实验验证的mTPs数据库过滤检测到的mTPs。这类数据库包括miRTarBase、TarBase和miRecords。
尽管有多种基于反相关的mTP检测方法,但对于哪种方法的结果最可靠,并没有明确的共识。在这里,Cordoba-Caballero等人提出了coRmiT(图1),一种基于mRNA和miRNA表达数据的分析、比较、选择和整合七种mTP相关策略的新方法,使用一系列反相关阈值。作者们将其应用于三个不同的数据集,它们具有非常不同的属性,都是罕见疾病的模型。通过分析每种方法在不同相关阈值下检测到的mTPs来评估策略,并将其与来自数据库的预测和实验验证的mTPs进行比较。coRmiT在miRNA水平上整合了相关策略的结果,并证明了其鲁棒性。coRmiT是ExpHunterSuite Bioconductor包的一部分,可以在https://bioconductor.org/packages/ExpHunterSuite免费下载使用。
图1 coRmiT方法的总体概述。对miRNA和基因表达的测序数据进行处理,生成所有可能的表达基因/miRNA对。使用结合个体基因/miRNA表达和共表达模块表达的不同策略计算这些对之间的相关性。基于与数据库中获得的mTPs的重叠,计算每种策略(总体优势比)和每种miRNA(特定优势比)的优势比。选择-整合方法对每个miRNA根据其特定的优势比对策略进行排序,并选择最优策略。整合的mTPs是用选择的策略检测到的每个miRNA。DEG和DEM分别代表差异表达的基因和miRNA。CPM是归一化的表达矩阵,以显示每个基因/miRNA每百万次映射读取的计数。特征基因和枢纽是每个共表达模块的代表性概要。mTPs是miRNA靶基因对。STRAT N代表一个示例相关策略,miR-N代表一个示例miRNA
参考文献
[1] Cordoba-Caballero J, Perkins JR, García-Criado F, et al. Exploring miRNA-target gene pair detection in disease with coRmiT. Brief Bioinform. 2024;25(2):bbae060. doi:10.1093/bib/bbae060
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 05:17
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社