||
miND:小RNA分析流程和miRNA生物标志物识别
小 RNA 测序已成为一种成熟的工具,用于在各种生物体液中定量短 RNA 分子,如 microRNA(miRNA)。这些短 RNA 分子(17 至 25nt)通过与靶向信使 RNA(mRNA)中的特定互补位点相互作用,在基因表达的细胞调控中发挥重要作用。含有这些靶标位点的 mRNA 随后会被下调(或极少情况下上调),从而对 mRNA 的下游翻译产生调控作用。在这种情况下,miRNA 是复杂调控网络的一部分,它们的表达不仅影响其他 mRNA,而且 miRNA 自身的表达也受到高度调控。因此,miRNA 的水平可以作为细胞调控状态的指标,并与生物体的健康状况相关。例如,肝脏特异性 miR-122-5p 在血清或血浆中测量时被证明是肝损伤的合适标志物,并且作为 miRNA 表达特征的一部分,甚至可以用于预测肝切除后的恢复情况。
这使得它们成为液体活检中具有吸引力的生物标志物靶点。寻找适合作为生物标志物的 miRNA 或 miRNA 特征需要专门的计算方法,并且在这类研究的发现阶段经常使用下一代测序(NGS)。目前有多种小 RNA 测序分析工具可供使用,从命令行工具如 miRDeep2和 miRge 3.0,到基于网络的平台如 Oasis 2.0和 sRNAbench,以及桌面应用程序如 UEA sRNA Workbench。这些工具涵盖了小 RNA 分析的各个方面,包括读段映射、miRNA 定量、新 miRNA 预测,在某些情况下还包括差异表达。然而,许多工具只关注单个分析步骤,并将结果整合及其以易于理解的形式呈现的任务留给用户。
为满足标准化和集成化分析流程的需求,Diendorfer等人开发了 miND(图1,https://github.com/tamirna/miND),这是一个小 RNA-seq 数据处理流程,将所有步骤从原始数据到差异表达整合在一个可重复的分析流程中。该流程生成一个全面的交互式 HTML 报告,旨在支持生物信息学家和生物学家的解读。实验元数据,包括样本分组和统计对比,通过一个基于 Excel 的对比表格提供,该表格作为湿实验室科学家和生物信息学家之间的结构化接口。

图1 表示通过管道进行数据处理的高级步骤的流程图。参考数据由仓库构建过程(黄色区域;右上角)下载和处理,然后可在仓库/子文件夹中供 miND 管道使用。原始下一代测序(NGS)数据(蓝色区域)首先进行接头去除和质量修剪,然后由质量控制(QC)工具处理,并通过分层映射步骤(绿色区域)进行处理。这些步骤生成一组映射文件,然后由 R 脚本摄取和分析,最终生成 miND 报告
Diendorfer等人开发了一个针对小 RNA NGS 数据的稳健且便携的分析流程,重点关注生物标志物发现,旨在实现三个目标:(1) 标准化数据输入,(2) 可重复的分析,以及(3) 为生物信息学家和研究统计学家提供易于访问的结果,包括适合发表的图表和直观的结果表示。
miND 流程可以在多种操作系统和不同配置中使用,唯一的要求是能够运行 Snakemake 工作流。提供了用于在基于 Linux 的系统中启动流程的包装脚本,这些脚本可以修改以用于不同平台。
参考文献
[1] Diendorfer A, Khamina K, Pultar M and Hackl M. miND (miRNA NGS Discovery pipeline): a small RNA-seq analysis pipeline and report generator for microRNA biomarker discovery studies. F1000Research 2026, 11:233 (https://doi.org/10.12688/f1000research.94159.2)
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
37. CancerSCEM 2.0:人类癌症单细胞表达谱数据资源
38. LncPepAtlas:探索lncRNA翻译潜力综合资源
40. MirGeneDB 3.0:miRNA家族和序列数据库
41. RegNetwork 2025:人类和小鼠基因调控网络整合数据库
42. CircTarget:多种细胞类型circRNA调控综合数据库
43. GreenCells:植物lncRNA单细胞分析资源
44. RM2Target 2.0:RNA修饰的写入者、擦除者和读取者靶基因数据库

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-6-27 23:37
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社