lixinhai的个人博客分享 http://blog.sciencenet.cn/u/lixinhai

博文

我的生物统计学课件(2014)

已有 35658 次阅读 2014-8-13 16:51 |系统分类:教学心得

我不时收到邮件索要生物统计学的课件。在2012年我把全部课件放在科学网上,供感兴趣的人下载。现在(两年后)我的课件更新了很多,在此上传最新版本。课件共有13个文件,是13次讲课的内容。每次讲课3小时,制作和修改一个课件的时间超过100个小时(2006年以来的累计时间)。这是我大约1500个小时的工作成果。课件语言为英文。

课件的内容主要基于教科书和文献。在2006年,我的课件约40%的内容取自于Zar教科书《生物统计分析》(Zar 1999),约10%的内容取自SokalRohlf教科书《生物统计学》(Sokal & Rohlf 1995),其他的参考了我在加拿大纪念大学(Memorial University)的老板David Schneider和在新布朗思维克大学(University of New Brunswick)的老板Matt Litvak的课件。2007年我引用了部分Quinn Keough写的《面向生物学家实验设计和数据分析》(Quinn & Keough 2002)的内容。这本书虽然不像ZarSokalRohlf的教科书那么经典,不过写得非常清楚,内容要深一些。以后我不断补充其他书籍和文献的内容,现在(2014年)这三本书在课件中的比重已经不足5%2011年我放弃SAS,改用R来教学生进行统计分析。R的内容主要参考了Crawley The R Book第一版(Crawley 2007)和第二版(Crawley 2012),以及Zuur等的几本书(Zuur et al. 2009a; Zuur et al. 2009b; Zuur et al. 2007)Faraway的著作(Faraway 2004)。这些R书理论结合实际(有数据有代码可以练手),非常好读。另外,维基百科、 R的帮助文件、各大论坛是另一大信息来源。近年来我在课件中加入许多我自己的体会,应用了不少自己的数据和结果(尤其在后面的广义线性模型和机器学习模型中)。


1. History and development of biostatistics 生物统计学的历史和发展(94)

    • Introduction 前言

      • Best practice in this class 学习方法

      • Text books 教科书

      • Statistical language R  R语言

    • Brief history of biostatistics 生物统计学简史

    • Key persons 关键历史人物

    • Basic concepts 基本概念

      • Data types 数据类型

      • Descriptive statistics 描述性统计

下载:1_Introduction to biological statistics.pdf

2. Probability distribution 率分布 (100)

    • Probability theory 概率论

    • Common distributions of random variables 常见的随机变量的分布

      • Binomial distribution 二项分布

      • Poisson distribution 泊松分布

      • Negative binomial distribution 负二项分布

      • Uniform distribution 均匀分布

      • Normal distribution 正态分布

      • Chi square distribution 卡方分布

      • F distribution F分布

下载:2_Probability distribution.pdf

3. Hypothesis testing 1 假设检验1 (82)

    • What is hypothesis testing? 什么是假设检验?

    • Standard procedures 标准步骤

    • Case studies 案例分析

      • T test and Z test  T检验和Z检验

      • Situations of one tail and two tails 单尾和双尾的情况

      • One sample hypothesis tests and two samples hypothesis tests 单样本和双样本的假设检验

      • Paired test 配对检验

下载:3_Hypothesis testing 1.pdf

4. Hypothesis testing 2 假设检2 (76)

    • Type I and Type II Errors 第一和第二类错误

    • Chi-square test 卡方检验

    • Power of test 统计功效

    • Sample size样本量

    • Philosophy of hypothesis testing 假设检验的哲学基础

下载:4_Hypothesis testing 2.pdf

5. Analysis of variance (ANOVA) 1 方差分析1 (80)

    • Rationale of ANOVA 方差分析的基本原理

    • Compared with T test, Chi-square test T检验、卡方检验的比较

    • Generic Recipe of general linear model一般线形方程的标准分析步骤

    • One-way ANOVA 单因素方差分析

    • Random blocked design 随机区组设计

    • Two-way ANOVA 双因素方差分析

下载:5_ANOVA_1.pdf

6. Analysis of variance (ANOVA) 2 方差分析2 (83)

    • Three-way ANOVA 三因素方差分析

    • Latin Square Design 拉丁方实验设计

    • Hierarchical (nested) ANOVA 嵌套方差分析

    • Split Plot Design 裂区设计

    • Repeated measures ANOVA 重复实验的方差分析

    • Mixed effects models 混合效应模型

下载:6_ANOVA_2.pdf

7. Simple linear regression and correlation 简单线性回归和相关(91)

    • Rationale of simple linear regression简单线性回归的原理

    • Least square 最小二乘法

    • Regression coefficient (slope) and intercept 斜率和截距

    • Significance of a regression 回归的显著性

    • Assumptions of regression analysis 线性回归的假设

    • Applications of simple linear regression 简单线性回归的应用

    • Rationale of simple linear correlation 简单线性相关的原理

    • Coefficient of Correlation 相关系数

    • Power and sample size in correlation 相关分析的统计功效和样本量

下载:7_Simple linear regression and correlation.pdf

8. Analysis of covariance (ANCOVA) 协方差分析(75)

    • Rationale of Analysis of covariance 协方差分析的原理

    • Assumptions of Analysis of covariance 协方差的假设条件

    • Compared with ANOVA and regression 与方差分析和回归的比较

    • Case studies 案例分析

    • Coding convention of R  R语言编程的通用习惯

下载:8_ANCOVA.pdf

9. Data transformation and Nonparametric statistics 数据转化和非参数检验  (84)

    • Data transformation数据转化

      • Logarithmic transformation 对数转化

      • Square root transformation 平方根转化

      • Arcsine transformation 反正旋转化

      • Reciprocal transformation 倒数转化

      • Square transformation 平方转化

      • Box-Cox transformation Box-Cox转化

    • Rationale of nonparametric statistics 非参数检验的原理

    • Sign test 符号检验

    • Wilcoxon signed rank test 符号秩检验

    • Wilcoxon rank sum test 秩和检验

    • Kruskal-Wallis test  Kruskal-Wallis检验

    • Friedman’s test  Friedman检验

    • Bootstraping  Bootstraping重取样

下载:9_Data transformation and nonparametric statistics.pdf

10. Multivariate analysis 1 多元统计分析1 (92)

    • Multiple regression 多元回归

      • Linear regression 线性回归

      • Non-linear regression 非线性回归

      • Evaluating multiple regression model 模型评价

    • Multiple correlation 多元相关

    • Partial correlation 偏相关

    • Canonical correlation analysis 典型相关分析

下载:10_Multivariate analysis 1.pdf

11. Multivariate analysis 2 多元统计分析2 (166)

    • Cluster analysis 聚类分析

    • Discriminant analysis 判别分析

    • Principal component analysis 主成分分析

    • Factor analysis 因子分析

    • Correspondence analysis 对应分析

    • Redundancy analysis 冗余分析

    • Canonical correspondence analysis 典型对应分析

    • Multidimensional scaling (principal coordinate analysis) 多维尺度分析

下载:11_Multivariate analysis 2.pdf

12. Generalized linear model 广义线性模型 (87)

    • Rationale of generalized linear model广义线形模型的原理

    • Logistic regression 逻辑斯蒂回归

      • Assumptions 前提条件

      • Biological means of the coefficients 系数的生物学意义

      • Goodness of fit 拟合优度

    • Maximum likelihood estimation 最大似然估计

    • Structure of generalized linear model 广义线形模型的结构

      • Random component 随机组分

      • Systematic component 系统组分

      • Link function 连接方程

    • Compared with general linear model 同一般线性方程的比较

    • Case studies 案例分析

下载:12_Generalized linear models.pdf

13. Advanced models 高级统计模型(75)

    • Generalized linear model (GLM) 广义线性模型

    • Generalized additive model (GAM) 广义可加模型

    • Multivariate Adaptive Regression Splines (MARS) 多元自适应回归样条

    • Mixture discriminant analysis (MDA) 混合判别分析

    • Classification and Regression Tree (CART) 分类与回归树

    • Generalized Boosting Models (GBM) 广义推进模型

    • Artificial neural networks (ANN) 人工神经网络

    • Random Forest (RF) 随机森林

    • Genetic Algorithm for Rule Set Production (GARP) 遗传算法

    • Maximum entropy method (Maxent) 最大熵模型

    • Bayesian method 贝叶斯方法

    • Hierarchical modeling 分级模型

下载:13_Advanced models.pdf


主要参考书籍

Crawley,M. J. 2007. The R Book. John Wiley & Sons Ltd.

Crawley, M. J. 2012. The R book. SecondEdition. John Wiley & Sons Ltd.

Faraway, J. J. 2004. Linear models with R. CRC Press.

Quinn, G. P., and M. J. Keough 2002.Experimental design and data analysis for biologists. Cambridge University Press.

Sokal, R. R., and F. J. Rohlf 1995. Biometry.Third Edition. W. H. Freeman and Company, New York.

Zar, J. H. 1999. Biostatistical Analysis.Pearson.

Zuur, A., E. N. Ieno, and E. Meesters 2009a. ABeginner's Guide to R. Springer.

Zuur, A., E. N. Ieno, N. Walker, A. A.Saveliev, and G. M. Smith 2009b. Mixed effects models and extensions in ecologywith R. Springer.

Zuur, A. F., E. N. Ieno, and G. M. Smith 2007.Analysing ecological data. Springer.




https://blog.sciencenet.cn/blog-661364-819273.html

上一篇:用随机森林模型替代常用的回归和分类模型
下一篇:我的生物统计学课件(2015)
收藏 IP: 159.226.67.*| 热度|

38 朱教君 刘苏峡 肖重发 王德华 魏玉保 王伟华 唐小卿 徐传胜 高大海 廖灏泓 朱朝东 刘淼 董川 陈筝 蔡庆华 陈照强 邵明波 张贺 万润兰 高建国 孙利鹏 张盖华 李洋 王海冰 仲银鹏 韩威 刘永稳 郭新磊 李学友 符辉 陈星 张伟 seeker99 rosejump weijing1987 dulizhi95 chaorengama MEDICALTUTU

该博文允许注册用户评论 请点击登录 评论 (38 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 22:36

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部