wangyanjiayou的个人博客分享 http://blog.sciencenet.cn/u/wangyanjiayou

博文

系统:R语言贝叶斯网络模型、R语言贝叶斯模型进阶、R语言现代贝叶斯统计学方法

已有 999 次阅读 2023-12-22 11:33 |系统分类:科研笔记

贝叶斯网络不但能够统合已有的各种统计学方法,如混合回归模型,LASSO,自回归模型,隐马模型等等;而且在很大程度上能够弥补统计学模型不能够进行因果推断的缺憾。以开源的R语言为平台,通过理论和实践相结合的方法,系统介绍了贝叶斯网络结构学习,参数学习以及因果推断等全过程,对贝叶斯网络有较全面的了解,并能够用于科研和工作实践中。

㈠ 基于R语言的贝叶斯网络模型的实践技术应用

【目标】:
1.了解贝叶斯网络(Bayesian Network)模型的基本原理
2.掌握利用R实现贝叶斯网络的主要包及其特点
3.掌握利用R实现贝叶斯静态和动态网络学习的步骤和流程
4.掌握利用R进行贝叶斯网络推理的要点
5.通过理论知识学习与上机实践操作,具备构建贝叶斯网络模型的能力,实现科研和生产实践目的

专题一:R语言实现Bayesian Network分析的基本流程
R语言的数据类型与基本操作
R语言中图论的相关操作
贝叶斯网络的图表示与概率表示
基于bnlearn建立简单的贝叶斯网络
专题二:离散静态贝叶斯网络的构建
离散静态网络的结构学习
离散静态网络的参数估计
离散静态网络的推断
实例分析
专题三:连续分布下的贝叶斯网络
连续贝叶斯网络的结构学习
连续贝叶斯网络的参数估计
高斯贝叶斯网络的推断
实例分析
专题四:混合贝叶斯网络
混合分布情况下的处理
贝叶斯统计在混合网络中的应用
实例分析
专题五:动态贝叶斯网络
时间序列中变量的选择
时间相关性的处理
动态贝叶斯网络
实例分析
专题六:基于Gephi的网络作图初步专题七:真实世界中的贝叶斯网络
Bootstrap与阈值选择
模型平均方法
非齐次动态贝叶斯网络
实例分析
注:请提前自备电脑及安装所需软件


㈡ R语言贝叶斯方法在生态环境领域中的高阶技术应用

本教程包括回归及结构方程模型概述及数据探索;R和Rstudio简介及入门和作图基础;R语言数据清洗-tidyverse包;贝叶斯回归与混合效应模型;贝叶斯空间自相关、时间自相关及系统发育相关数据分析;贝叶斯非线性数据分析;贝叶斯结构方程模型及统计结果作图等。教程不仅适合R语言和生态环境数据统计分析初学者,也适合有高阶应用需求的研究生和科研人员。将通过大量实例讲解,使大家能应对科研工作中复杂数据局面,选择合适模型,提高数据分析能力。

专题一:完成预习
1.1复杂数据回归(混合效应)模型的选择策略
①科学研究中数据及其复杂性
②回归分析历史、理论基础
③回归分析基本假设和常见问题
④复杂数据回归模型选择策略
1.2结构方程模型(SEM)生态领域应用简介
①SEM的定义、生态学领域应用及历史回顾
②SEM的基本结构
③SEM的估计方法
④SEM的路径规则
⑤SEM路径参数的含义
⑥SEM分析样本量及模型可识别规则
⑦SEM构建基本流程
1.3如何通过数据探索避免常见统计问题
①数据缺失(missing value)
②零值(zero trouble)
③奇异值/离群值(outliers)
④异质性(heterogeneity)
⑤数据分布正态性(normality)
⑥响应变量与预测变量间关系(relationships)
⑦交互作用项(interaction)
⑧共线性(collinearity)
⑨样本独立性(independence)
专题二:R和Rstudio简介及入门和作图 
①R及Rstudio介绍:背景、软件及程序包安装、基本设置等
②R语言基本操作,包括向量、矩阵、数据框及数据列表等生成和数据提取等
③R语言数据文件读取、整理、结果存储等
④R语言基础绘图(含ggplot):基本绘图、排版、发表质量绘图输出存储
专题三:R语言数据清洗-tidyverse包应用 
①tidyvese简介:tidyr、dplyr、readr、%>%等
②文件操作:不同格式文件读取、多文件同时读取等
③数据筛选:行筛选、列筛选、条件筛选(字符操作)等
④数据生成:数据合并、数据拆分、新数据生成(字符操作)等
⑤长宽数据转换、空值(NA)等填充及删除、分组、排序及汇总等
专题四:贝叶斯回归模型-回归、方差及协防差分析
①贝叶斯统计简介
②贝叶斯回归分析建模、模型诊断、交叉验证、预测和作图
③贝叶斯回归分析多预测变量:回归、方差、协方差及交互作用
④贝叶斯回归模型的过度拟合、共线性、分类变量等
专题五:贝叶斯混合效应模型-数据分层和嵌套
①混合效应模型基本原理
②贝叶斯效混合应模型建模步骤及实现
③贝叶斯的预测和模型诊断
④贝叶斯混合效应模型的多重比较
⑤贝叶斯混合效应模型的方差分解
专题六:贝叶斯计数数据分析
①贝叶斯0,1数据分析:二项分布及伯努利分布
②贝叶斯泊松分布数据分析
③贝叶斯过度离散数据分析
④贝叶斯零膨胀数据分析
⑤贝叶斯截断数据分析
专题七:贝叶斯相关数据分析:时间、空间、系统发育相关数据
①贝叶斯回归模型方差异质性问题及解决途径
②贝叶斯时间自相关分析:线性及混合效应模型及时间自相关+方差异质性
③贝叶斯空间自相关分析:空间距离矩阵、空间邻接关系及矩阵
④贝叶斯系统发育相关分析
专题八:贝叶斯非线性关系数据分析:广义可加(混合)模型(BGAM/BGAMM)和非线性(混合)(BNLM/BNLMM)模型
①“线性”回归的含义及非线性关系的判定
②贝叶斯广义可加(混合效应)(GAM/GAMM)模型
③贝叶斯非线性(混合效应)(NLM/NLMM)模型
专题九:贝叶斯结构方程模型(BSEM)
①R语言贝叶斯SEM实现程序包blavaan和brms介绍
②案例1:气候及生态位重叠程度对田鼠物种丰富度影响:模型比较、直接和间接效应计算(blavaan&brms)
③案例2:火烧后对植被恢复影响因素-模型拟合、模型比较和评估(brms)
④案例3:生物地理历史因素对北半球森林的初级生产力的影响(brms)
专题十:超越贝叶斯统计:因果推断
①因果推断概述-因果关系之梯
②因果推断实现(DAG)
③贝叶斯回归VS贝叶斯网络-揭开因果迷雾
专题十一:贝叶斯统计结果作图
①贝叶斯分析结果数据提取和作图准备
②贝叶斯回归模型结果图:散点图、预测图、箱线图、柱状图、提琴图、密度图及峰峦图等
③贝叶斯结构方程模型结果图表达
注:请提前自备电脑及安装所需软件


㈢ 基于R语言贝叶斯进阶:INLA下的贝叶斯回归、生存分析、随机游走、广义可加模型、极端数据的贝叶斯分析

贝叶斯统计学是一门基本思想与传统基于频率思想的统计学完全不同的统计学方法;它以其灵活性和先进性在现代的统计学中占据着重要的地位。贝叶斯回归方法作为传统回归技术在贝叶斯统计学中的拓展,在各个专业领域中都有着广泛的应用。然而。贝叶斯回归结合了回归和贝叶斯思想,其计算方法和技术以及模型结果的解释都较为复杂,能够让广大研究者准确应用贝叶斯回归,打通学科专业与贝叶斯回归间的壁垒。

专题一:贝叶斯模型的步骤
1.贝叶斯定理
2.先验与后验分布
3.假设检验
4.模型选择
5.贝叶斯计算方法简介
专题二:积分嵌套拉普斯近似
1.隐高斯模型
2.高斯-马尔科夫随机场
3.拉普拉斯近似与INLA
专题三:INLA下的贝叶斯回归(一)
1.线性回归的贝叶斯推断
2.预测模型
3.贝叶斯下的模型选择
4.稳定回归
5.方差分析
专题四:INLA下的贝叶斯回归(二)
1.Ridge回归
2.计数数据与泊松回归
3.偏斜数据的伽马回归
4.零膨胀数据建模
5.负二项回归初步
专题五:多层贝叶斯回归
1.随机效应多层模型
2.嵌套效应多层模型
3.面板(测量)数据的多层模型
4.计数数据的多层模型
专题六:生存分析
1.分段线性风险模型
2.分层比例风险模型
3. 加速失效模型
4. 脆弱模型
5. 面板与时间-事件数据的联合建模
专题七:随机游走非参数模型
1.光滑曲线模型
2.非高斯数据模型
3.罚曲线回归
4.广义非参数回归
专题八:广义可加模型
1.可加曲线回归
2.广义可加混合效应模型
3.计数数据的广义可加模型
专题九:极端数据的贝叶斯分析与其他
1.极值统计学简介
2.极值统计学的贝叶斯估计
3.基于INLA的密度估计
注:请提前自备电脑及安装所需软件


 ㈣ 基于R语言的现代贝叶斯统计学方法(贝叶斯参数估计、贝叶斯回归、贝叶斯计算)实践

贝叶斯统计学是一门基本思想与传统基于频率思想的统计学完全不同的统计学方法;它以其灵活性和先进性在现代的统计学中占据着重要的地位。贝叶斯统计学是开展科学研究不可缺少的重要手段,但是,因为其思想、技术和方法都与传统统计学有着较大区别;且其计算中涉及马尔科夫、蒙特卡罗和吉布斯采样等现代计算方法,对使用者经验和能力构成了很大的挑战。让广大研究者准确灵活的应用贝叶斯统计学,打通学科专业与贝叶斯统计学间的壁垒。

专题一:贝叶斯统计学的思想与概念
1.信念函数与概率
2.事件划分与贝叶斯法则
3.稀少事件的概率估计
4.可交换性
5.预测模型的构建
专题二:单参数模型
1.二项式模型与置信域
2.泊松模型与后验分布
3.指数族模型与共轭先验
专题三:蒙特卡罗逼近
1.蒙特卡罗方法
2.任意函数的后验推断
3.预测分布采样
4.后验模型检验
专题四:正态模型
1.均值与条件方差的推断
2.基于数学期望的先验
3.非正态分布的正态模型
专题五:吉布斯采样
1.半共轭先验分布
2.离散近似
3.条件分布中的采样
4.吉布斯采样算法及其性质
5.MCMC方法
专题六:多元正态分布与组比较
1.多元正态分布的密度
2.均值的半共轭先验
3.逆-Wishart分布
4.缺失数据与贝叶斯插补
5.组间比较
6.分层模型的均值与方差
专题七:线性回归
1.回归的本质与最小二乘法
2.回归的贝叶斯估计
3.模型的贝叶斯比较
4.吉布斯采样与模型平均
5.指数模型比较与选择
6.总结与结论
7.Python的Copula相关包介绍
专题八:非共轭先验与M-H算法
1.广义线性模型
2.泊松模型Metropolis算法
3.Metropolis-Hastings算法
4.M-H算法与吉布斯采样的组合
专题九:线性与广义线性混合效应模型
1.多层回归模型
2.全条件分布
3.广义线性混合效应模型
专题十:有序数据的隐变量模型
1.有序Probit回归
2.秩的似然
3.高斯Copula模型
注:请提前自备电脑及安装所需软件


 ㈤ R语言混合效应(多水平/层次/嵌套)模型及贝叶斯实现

混合效应模型形式灵活可以应对现代科学研究中各种数据情况,与传统回归模型相比具有更为强大数据分析能力,且结果更为可信。本课程将分为复杂数据的回归及混合效应模型概述及数据探索;回归与混合效应模型,包括一般线性回归(lm)、广义线性回归(glm);线性混合效应模型(lmm)及广义线性混合效应模型(glmm);贝叶斯(brms)回归与混合效应模型;相关数据回归与混合效应模型及贝叶斯实现,包括嵌套数据、时间自相关数据,空间自相数据及系统发育数据分析;非线性数据回归分析及贝叶斯实现,包括广义可加(混合)模型和非线性(混合)模型等。课程将通过大量实例讲解,使大家能应对科研工作中复杂数据局面,选择合适模型,提高数据分析能力。

预习:复杂数据的回归及混合效应模型概述及数据探索
1.复杂数据回归模型的选择策略
①科学研究中数据及其复杂性
②回归分析历史、理论基础
③回归分析基本假设和常见问题
④复杂数据回归模型选择策略
2.如何通过数据探索避免常见统计问题
①数据缺失(missing value)
②零值(zero trouble)
③奇异值/离群值(outliers)
④异质性(heterogeneity)
⑤数据分布正态性(normality)
⑥响应变量与预测变量间关系(relationships)
⑦交互作用项(interaction)
⑧共线性(collinearity)
⑨样本独立性(independence)
专题一:回归与混合效应(多水平/层次/嵌套)模型
1.一般线性模型(lm)
①基本形式、基本假设、估计方法、参数检验、模型检验
②一般线性回归、方差分析及协方差分析
③一般线性回归模型验证
④一般线性回归模型选择-逐步回归
案例1:鱼类游速与水温关系的回归及协方差分析
案例2:施肥和种植密度对作物产量的影响
案例3:决定海洋植食性鱼类多样性的决定因子-模型验证
案例4:淡水鱼丰度的环境因子的筛选-逐步回归
2.广义线性模型(glm)
①基本形式、基本假设、估计方法、参数检验、模型检验
②0,1数据分析:伯努利分布、二项分布及其过度离散问题
③计数数据各种情况及模型选择:泊松、伪泊松、负二项、零膨胀泊松、零膨胀负二项、零截断泊松及零截断负二项模型
④广义线性模型的模型比较和选择-似然比LR和AIC
案例1:动物身体特征与患病与否(0,1)的关系的逻辑斯蒂回
案例2:海豹年龄与攻击行为的关系-0,1数据转化为比率数据分析
案例3:不同实验处理下蚜虫多度的差异分析-计数数据泊松回归
其他案例:零膨胀、零截断数据分析
3.线性混合效应模型(lmm)
①线性混合效应模型基本原理
②线性混合效应模型建模步骤及实现
③线性混合效应模型的预测和模型诊断
④线性混合效应模型的多重比较
案例1:睡眠时间与反应速度关系
案例2:多因素实验(分层数据)的多重比较
4.广义线性混合效应模型(glmm)
①广义线性混合效应模型基本原理
②广义线性混合效应模型建模步骤及流程
③广义线性混合效应模型分析0,1数据
④广义线性混合效应模型分析计数数据及模型选择:泊松、伪泊松、负二项、零膨胀泊松、零膨胀负二项、零截断泊松及零截断负二项模型
案例1:蝌蚪“变态”与否(0,1)的多因素分析-逻辑斯蒂混合效应模型
案例2:虫食种子多度影响因素的多变量分析-泊松混合效应模型
案例3:模拟计数数据-零膨胀、零截断、过度离散等广义混合效应模型
专题二:贝叶斯(brms)回归与混合效应(多水平/层次/嵌套)模型
1.贝叶斯回归及混合效应模型上
①贝叶斯回归分析简介
②利用brms实现贝叶斯回归分析简介
③贝叶斯回归分析的模型诊断、交叉验证、预测和作图
④贝叶斯广义线性模型实现:gamma分布、伯努利分布、二项分布等
案例1:鱼游速与温度关系的贝叶斯回归-结果解读、模型验证、模型诊断
案例2:森林生物量与林龄关系贝叶斯回归-gamma分布、brms参数调整
案例3:动物身体特征与患病与否(0,1)的关系的贝叶斯回归-伯努利分布
案例4:海豹年龄与攻击行为的关系-0,1数据转化为比率数据分析-二项分布
其他案例:贝叶斯分析计数数据过度离散、零膨胀等问题
2.贝叶斯回归及混合效应模型下
①贝叶斯线性混合效应模型:实现步骤、模型验证、多重比较
②贝叶斯广义混合效应模型-计数数据分析:泊松、负二项、零膨胀泊松、零膨胀负二项等
案例1:睡眠时间与反应速度关系的贝叶斯线性混合效应模型
案例2:教师受欢迎程度的多变量预测-贝叶斯线性混合效应模型
案例3:虫食种子多度(计数数据)影响因素的多变量分析-贝叶斯广义混合效应模型
其他案例:贝叶斯分析计数数据过度离散、零膨胀等问题
专题三:相关数据回归分析:嵌套、时间、空间、系统发育相关数据分析
1.嵌套型随机效应混合效应模型分析及贝叶斯实现
①数据分层问题及嵌套型随机效应混合效应模型介绍
②嵌套型随机效应混合效应模型分析步骤及流程及模型选择(MuMIn)
③嵌套型随机效应混合效应模型的方差分解:ICC、varcomp及贝叶斯法
④经典方差分解案例讲解
案例1:不同种类海豚年龄多因素预测模型及模型选择(MuMIn)- 嵌套结构
案例2:纲/科/属/种型嵌套随机效应的方差分解及贝叶斯方法
案例3:物种属性可塑性和基因多样性对物种丰富度影响的相对贡献-全模型变差分解
2.时间相关数据分析及贝叶斯实现
①回归模型的方差异质性问题及解决途径
②时间自相关分析:线性及混合效应模型及贝叶斯方法
③时间自相关+方差异质性分析及贝叶斯实现
案例1:模拟数据方差异质性问题-gls,lmm及brms方法比较
案例2:鸟类多度变化的时间自相关分析-gls vs brms
案例3:资源脉冲与食谱关系分析:方差异质性+时间相关-lmm vs brms
3.空间相关数据分析及贝叶斯实现
①空间自相关概述
②空间自相关问题解决方式:自相关修正参数、空间距离权重法、空间邻接权重法
③空间自相关问题修正基本流程-gls和lme
④空间自相关贝叶斯修正-空间距离权重 VS 空间邻接权重
案例1:北方林物种多样性与气候关系-一般线性回归模型空间自相关问题修正
案例2:全球水鸟巢穴捕食率影响因素分析-混合效应模型空间自相关问题修正
4.系统发育相关数据分析及贝叶斯实现
①系统发育简介:系统发育假说、系统发育信号及系统发育树
②系统发育树及系统发育距离矩阵构建
③系统发育信息纳入回归模型-广义最小二乘(gls)
④系统发育信息纳入混合效应模型(lmm/glmm)及贝叶斯方法实现案例
案例1:模拟数据-系统发育相关对物种属性影响-gls vs brms
案例2:全球水鸟巢穴捕食率影响因素分析-系统发育混合效应模型:lmm vs brms
专题四:非线性关系数据分析:广义可加(混合)模型(GAM/GAMM)和非线性(混合)(NLM/NLMM)模型
①“线性”回归的含义及非线性关系的判定
②广义可加(混合效应)(GAM/GAMM)模型及贝叶斯实现
③非线性(混合效应)(NLM/NLMM)模型及贝叶斯实现
注:请提前自备电脑及安装所需软件


更多应用:包含Python机器学习、数据挖掘、PyTorch机器学习、MATLAB机器学习、R语言【Tidyverse、Tidymodel】、地理加权回归、结构方程模型、贝叶斯网络模型、混合效应(多水平层次嵌套)模型、Copula变量相关性、极值统计学、分位数回归、网络爬虫、科研数据可视化、Nvivo、Citespace和vosviewer文献计量学、AI人工智能等...
关 注【科研充电吧】公 众 号,获取海量教程和资源



https://blog.sciencenet.cn/blog-3539141-1414917.html

上一篇:生物群落(生态)丨R基础及数据准备、多元统计分析、机器学习、回归及混合效应模型、结构方程模型、统计结果作图等
下一篇:ChatGPT/GPT4+AI绘图+文本+编程+论文高效写作结合到底有多强大?带你详细了解【海口、昆明】
收藏 IP: 111.225.75.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 04:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部