||
pathlinkR:转录组数据的通路和网络分析
转录组是最流行的组学方法之一,因为它通过分析基因表达变化提供了对各种研究的生物学见解,并且适用于任何具有参考基因组的生物。将一种或多种感兴趣的条件与参考或对照样本进行比较,可以确定由于条件或治疗而在表达上发生变化的基因。然而,仅凭差异表达基因(differentially expressed genes,DEG)的列表本身不足以得出有关其作用机制的有意义结论,必须对其进行进一步分析。有几种路径可供选择,其中最常见的两种方法是通路富集和网络分析,这些可以结合起来进一步提取生物学意义。虽然有几个工具和资源来执行这些任务,但它们往往存在于单独的包中,使得整合它们变得困难,特别是对于那些没有生物信息学技术背景的科研人员。
最近,Blimkie等人介绍了一个R包pathlinkR,它提供了一个简化和统一的界面来执行一些最常见的DEG分析和可视化,其功能可以帮助用户轻松执行通路富集和网络分析。它被设计成易于使用,并接受典型分析管道中最常用工具DESeq2和edgeR的输入。DESeq2和edgeR两个软件包都会生成一个DEG表,pathlinkR无需修改即可使用该表输入进行核心功能分析,包括可视化、通路富集和蛋白质-蛋白质相互作用(PPI)网络的构建。这些分析可以在许多数据库上执行,包括Reactome、MSigDB、KEGG和InnateDB,它们都是一致的格式,以便简单地合并到新的分析管道中。对于pathlinkR支持的每一种分析类型,用户都可以生成高质量图像来总结他们的发现(图1)。
图1 由pathlinkR生成的部分结果图。A:火山图。B:由pathlinkR使用InnateDB的PPI数据创建的PPI网络,节点颜色表示Fold变化方向,关键枢纽节点用蓝色或黑色标签突出显示。C:绘制免疫通路结果,在x轴上用三角形表示每种情况下通路的存在和方向性,在y轴上按字母顺序排序。星号表示一条通路在两个方向上都很重要。只描绘了一个三角形,对应于p值较低的方向。D:由通路富集结果构建的网络,节点代表单个通路,对于相似度超过特定阈值的通路绘制边
pathlinkR可从Bioconductor (https://bioconductor.org/packages/pathlinkR/)安装,并可通过Bioconductor论坛获得支持。代码,示例和支持数据可以在GitHub存储库https://github.com/hancockinformatics/pathlinkR上获得。
参考文献
[1] Blimkie TM, An A, Hancock REW. Facilitating pathway and network based analysis of RNA-Seq data with pathlinkR. PLoS Comput Biol. 2024 Sep 16;20(9):e1012422. doi: 10.1371/journal.pcbi.1012422.
以往推荐如下:
5. EMT标记物数据库:EMTome
8. RNA与疾病关系数据库:RNADisease v4.0
9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM
19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA
22. 研究资源识别门户:RRID
24. HMDD 4.0:miRNA-疾病实验验证关系数据库
25. LncRNADisease v3.0:lncRNA-疾病关系数据库更新版
26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA
28. RMBase v3.0:RNA修饰的景观、机制和功能
29. CancerProteome:破译癌症中蛋白质组景观资源
30. CROST:空间转录组综合数据库
31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具
33. CanCellVar:人类癌症单细胞变异图谱数据库
36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-10 19:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社