zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

hubEnsembles:R集成方法

已有 1108 次阅读 2024-7-24 17:02 |个人分类:科普|系统分类:科普集锦

hubEnsemblesR集成方法

对未来结果的预测对规划和决策至关重要,但对未来做出可靠的预测是一项挑战。克服这一挑战的一种方法是将多个独立模型的预测结合起来。这些组合方法(也称为聚合或集合)已被反复证明可以产生更准确的预测,并且比单个模型更加一致。由于明显的性能优势,多模型集成在各个领域都很常见,包括天气、气候和经济学。最近,多模型集成已用于改进传染病暴发的预测。

在快速发展的爆发预测领域,有许多生成集成的方法被提出。通常,这些方法至少在以下两种方式中的一种有所不同:(1)用于组合或平均预测的函数,以及(2)在执行组合时如何对预测进行加权。没有一种方法是普遍的最好的。因为已有的理论原因,预测的简单平均数在一系列设置中效果惊人地好。然而,更复杂的方法也被证明在某些情况下有好处。在这里,Shandross等人介绍了一款hubEnsembles工具R包(https://github.com/hubverse-org/hubEnsembles,图1),它为从多个模型生成集成预测提供了一个灵活的框架。hubEnsembles支持多种类型的预测,包括点估计和不同类型的概率预测。在整个过程中,作者们将使用术语预测来指代可能组合的任何类型的模型输出,包括预测、场景预测或参数估计。

image.png

1 hubEnsembles界面与安装

hubEnsembles软件包是“hubverse”开源软件和数据工具集合的一部分。hubverse项目促进了协作建模练习的开发和管理(2024年传染病建模中心联盟)。更广泛的hub计划是由协作中心的演示收益所驱动的,包括多模型集成的性能优势以及跨此类中心标准化的愿望。文献《hubEnsembles: Ensembling Methods in R》将特别关注hubEnsembles中包含的功能。作者们提供了实现方法的概述,包括数学定义和属性以及实现细节,使用简单示例的基本功能演示,以及使用真实流感预测进行更深入的分析,从而激发对各种方法的讨论和比较。

如果想了解和入门集成模型,hubEnsembles工具包学习将会是一个很好的选择。

参考文献

[1] Shandross L, Howerton E, Contamin L, et al. hubEnsembles: Ensembling Methods in R. Preprint. medRxiv. 2024;2024.06.24.24309416.

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

 

image.png

 



https://blog.sciencenet.cn/blog-571917-1443574.html

上一篇:FORGEdb:候选功能变异和复杂疾病靶基因识别工具
下一篇:DeepGSEA:单细胞转录组数据的可解释深度基因集富集分析
收藏 IP: 39.128.48.*| 热度|

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-10 07:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部