wangyanjiayou的个人博客分享 http://blog.sciencenet.cn/u/wangyanjiayou

博文

生物群落(生态)丨R基础及数据准备、多元统计分析、机器学习、回归及混合效应模型、结构方程模型、统计结果作图等

已有 1368 次阅读 2023-12-19 14:31 |系统分类:科研笔记

融合《R语言基础》、《tidyverse数据清洗》、《多元统计分析》、《随机森林模型》、《回归及混合效应模型》、《结构方程模型》、《统计结果作图》七合一版本教学方案

R语言的开源、自由、免费等特点使其广泛应用于生物群落数据统计分析。生物群落数据多样而复杂,涉及众多统计分析方法。本教程以生物群落数据分析中的最常用的统计方法回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法为主线,通过多个来自经典研究中的实例,详细讲述各方法的R语言实现途径(详见教学内容)。主要特点为聚焦生态学研究领域,从R语言基础操作和作图、数据准备整理,到各种数量分析方法的应用情景分析,实现从数据整理到分析结果展示的完整科学研究数据分析过程,将《R语言基础》、《tidyverse数据清洗》、《多元统计分析》、《随机森林模型》、《回归及混合效应模型》、《结构方程模型》及《统计结果作图》进行了组合(7合1)。
不仅适合R语言和生物群落(生态)数据统计分析的初学者,同样适合有高阶应用需求的研究生和科研人员。通过大量实例讲解,使大家能应对科研工作中复杂数据局面,选择合适模型,提高数据分析能力。

第一单元 R基础及数据准备

专题一:R和Rstudio简介及入门和作图基础
①R及Rstudio介绍:背景、软件及程序包安装、基本设置等
②R语言基本操作,包括向量、矩阵、数据框及数据列表等生成和数据提取等
③R语言数据文件读取、整理及存储等
④R语言基础绘图(含ggplot):基本绘图、排版、发表质量绘图输出存储

专题二:R语言数据清洗-tidyverse包应用 
①tidyvese简介:tidyr、dplyr、readr、%>%等
②文件操作:不同格式文件读取、多文件同时读取等
③数据筛选:行筛选、列筛选、条件筛选(字符操作)等
④数据生成:数据合并、数据拆分、新数据生成(字符操作)等
⑤长宽数据转换、空值(NA)等填充及删除、分组、排序及汇总等

专题三:群落数据准备及探索分析
①生物群落数据准备:物种组成、环境变量、物种功能属性、系统发育树等
②生物群落数据检查:缺失值和离群值(outliers)等-避免模型错进错出(GIGO)
③物种多样性计算:物种多样性(TD)、功能多样性(FD)和系统发育多样性(PD)
④物种相似/相异矩阵关联测度介绍

第二单元 多元统计分析

专题四:群落数据非约束排序-PCA、CA、PCoA、NMDS 
①生物群落数据非约束排序分析简介
②案例1鱼类生境数据排序:PCA
③案例2鸟类物种组成数据的排序:CA、PCoA和NMDS比较

专题五:群落数据约束排序-RDA、dbRDA、CCA、4th Corner
①生物群落数据约束排序简介:非对称约束排序VS对称约束排序
②案例1景观、斑块及生境因子蛾类群落分布的解释:RDA、dbRDA或CCA选择+变差分解
③案例2物种有无(0,1)数据约束排序:dbRDA
④案例3物种组成、物种属性及环境因子的相关分析-第四角分析(4th Corner)

专题六:群落数据分组分析: 等级/非等级聚类(HC/NHC)、PERMANOVA等
①生物群落数据的聚类及差异分析概述
②案例1鸟类生境数据的等级和非等级聚类:KMEANS和HCLUST
③案例2乌龟适宜生境差异检验(2组比较)及解释:PERMANOVA、MRPP、ANOSIM及Dispersion test
④案例3环境梯度下微生物组成差异分析(多组比较)及解释:MRPP及Dispersion Test
⑤案例4 药物对肠道微生物群落影响:PCoA+PERMANOVA

第三单元 机器学习

专题七:群落数据随机森林(Random Forest)模型-分类VS回归
①随机森林(Random Forest)模型简介
②随机森林模型分析基本流程-分类VS回归
③案例1 随机森林分类及重要变量选择:RFM-classification
④案例2 随机森林回归模型及变量重要性评估:RFM-regression
⑤案例3 物种多维形态属性与生态属性的关联关系:PCA+PCoA+LDA+RFM综合案例

第四单元 回归及混合效应模型

专题八:一般线性模型(lm)
①基本形式、基本假设、估计方法、参数检验、模型检验
②案例1不同鱼类游速的回归、方差及协方差分析
③案例2决定海洋植食性鱼类多样性的决定因子-模型验证
④案例3淡水鱼丰度的环境因子的筛选-逐步回归(model selection)

专题九:广义线性模型(glm)
①广义线性混合效应模型基本原理、建模步骤及流程
②案例1有无(0,1)数据的逻辑斯蒂模型-二项分布
③案例2海豹年龄与攻击行为的关系-0,1数据转化为比率数据分析
④案例3 物种多度分布环境解释-计数数据泊松、负二项、零膨胀、零截断模型

专题十:线性混合效应模型(lmm)
①混合效应的基本原理及分析基本流程、步骤及实现
②案例1分层数据物种多样性决定因素-模型构建流程、模型预测及诊断
③案例2:多因素实验(分层数据)的多重比较

专题十一:广义线性混合效应模型(glmm)
①广义线性混合效应模型基本原理、建模步骤及流程
②案例1蝌蚪“变态”与否(0,1)的多因素分析-逻辑斯蒂混合效应模型
③案例2虫食种子多度影响因素的多变量分析-泊松混合效应模型 
④广义线性混合效应模型分析计数数据及模型选择:泊松、伪泊松、负二项、零膨胀泊松、零膨胀负二项、零截断泊松及零截断负二项模型

专题十二:空间、时间及系统发育相关回归-数据自相关(autocorrelation)分析
①数据自相关问题简介:时间、空间和系统发育相关介绍
②案例1森林植物多样性分布格局的空间自相关修正
③案例2不同年份鸟类多度的时间自相关修正
④案例3系统发育相关在虾类多度分布分析中作用

第五单元 结构方程模型

专题十三:结构方程模型(SEM):lavaan和piecewiseSEM-多变量直接和间接效应及因果关系
①结构方程模型简介:定义、历史、应用、估计方法、模型可识别规则及样本量要求等
②案例1群落物种丰富度恢复的直接及间接效应(direct and indirect effects):SEM分析基本流程-lavaan vs piecwiseSEM
③案例2环境异质性和资源可获得性对不同演替阶段林下维管植物多样性的影响:模型调整、比较、评估及结果展示
④案例3人类活动、环境条件、物种属性对动物领域大小相对贡献(relative roles):混合模型、嵌套结构、分组分析及分类变量SEM实现

第六单元 统计结果作图

专题十四:群落数据及统计分析结果作图(ggplot)、排版及发表质量图输出
①群落数据及统计分析结果作图数据准备:结果提取与作图数据整理
②聚类分析及分组差异检验图:聚类结果图、热图(heatmap)、分组差异检验结果图
③PCA、CA、PCoA及NMDS等非约束排序图:排序图和双序图(biplot)
④RDA、db-RDA及CCA等约束排序图:三序图(triplot)和韦恩图(venn)
⑤回归和混合效应模型分析结果图:散点图、箱线图、柱状图及提琴图等
⑥结构方程模型结果图表达方式
注:请提前自备电脑及安装所需软件
更多应用:包含Python机器学习、数据挖掘、PyTorch机器学习、MATLAB机器学习、R语言【Tidyverse、Tidymodel】、地理加权回归、结构方程模型、贝叶斯网络模型、混合效应(多水平层次嵌套)模型、Copula变量相关性、极值统计学、分位数回归、InVEST模型、PLUS模型、DNDC模型、APSIM模型、DSSAT模型、MAXENT模型、CENTURY模型、CASA模型、BGC模型、CLM模式、CESM模式、CLUE模型、FLUS模型、PROSAIL模型、Meta分析、BIOMOD2模型、物种气候生态位、物候提取、Python地球科学、Noah-MP陆面过程模型、CLUE模型、Fragstats景观格局分析、GEE遥感云大数据、Matlab/Python高光谱遥感、DICE模型、LEAP模型、双碳、ArcGIS、ArcGIS Pro等...
关 注【科研充电吧】公 众 号,获取海量教程和资源



https://blog.sciencenet.cn/blog-3539141-1414481.html

上一篇:大气污染扩散模型Calpuff应用
下一篇:系统:R语言贝叶斯网络模型、R语言贝叶斯模型进阶、R语言现代贝叶斯统计学方法
收藏 IP: 111.225.67.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-24 10:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部