育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

混合线性模型软件包的介绍

已有 6156 次阅读 2016-10-8 11:22 |个人分类:翻译博客|系统分类:科研笔记

对于田间试验和农业数据分析,请加入下面QQ群:VSNC GenStat 交流群 203276907

快速加入群,可以点击这个链接,里面有大量的资料可以下载和交流:点击链接加入群【VSNC GenStat 交流群】:https://jq.qq.com/?_wv=1027&k=42XYzLq  



混合线性模型是一般线性模型的延伸和拓展,在作物、林木、动物、水产育种和科研中应用广泛。相对于一般线性模型,它能处理缺失值和不平衡数据,可以支持数据的方差不齐次和不独立,使得数据分析更准确和高效。分析混合线性模型的软件很多,这里将其分为R包和非R包。

R包:

nlme:是一个在S-Plus应用广泛的混线性模型包,后来转换到R平台上,对于镶嵌结构(nested)的随机因子定义简单,但对于交叉的随机因子(crossed)定义困难。具有多个功能,比如lme应用于线性混合模型,nlme应用于非线性混合模型。可以定义复杂的方差结构,不支持广义线性混合模型(GLMM

lme4:是nlme的进一步发展,支持GLMM,很难处理交叉的随机因子,比nlme运行速度要快

MCMCglmm:用马尔可夫链蒙特卡罗(Markov Chain Monte CarloMCMC)的方法拟合模型,贝叶斯先验分布,可以定义一些复杂的方差结构(heterogeneous yes AR1 no

asreml:是ASReml软件的R版本,运算速度快,支持复杂的模型(G矩阵和R矩阵),支持系谱信息和多性状分析,在动物、作物、林木、水产育种和科研中应用广发。

glmmADMB:是ADMB软件的R版本,很灵活,但是运行速度很慢。

R包:

*  ASReml 商业软件:对于第三世界的科研单位是免费的,有单机版(WinLinuxMac)和R版(ASReml-R),也有窗口化的版本(GenStat),应用稀疏矩阵和Ai算法,速度很快,广泛应用于植物和动物育种,支持随机因子的矩阵定义(G)和残差的矩阵定义(R),Splines也被很好的整合,对于广义线性模型,应用的是PQL方法。

*  ADMB:自动模型微分(Automatic Differentiation Model Builder),主要应用在森林、水产和野生动物中,开始时是个商业软件,现在开源了,支持非线性混合模型。

*  SAS 商业软件:

n  PROC MIXED:一般线性混合模型(LMM),应用广泛,但是速度比较慢。

n  PROC GLIMMIX:增加了广义线性模型(GLMM),它现在支持了Laplace approximationadaptive Gaussian quadrature方法,但对于复杂的模型,用的还是PQL方法。

n  HPMIXED:是MIXED的改进版,在速度上有明显的提升,但是支持的模型较少。

n  PROC NLMIXED:支持非线性混合模型

功能介绍:




软件

函数

方法

置信区间

随机(G矩阵)

残差(R矩阵)

其它

nlme

lme

ML

REML

标准差(SD

Nested

block

相关联(corStruct

异质性(varStruct

速度较慢

没有给出方差组分

lme4

lmer

ML

REML

标准误(se

Nested

Diagonal

block

NO

不支持系谱

不支持多性状分析

ARreml

asreml

AI

REML

标准误(se

Nested

Cross

Block

Splines

AR

Cor

Str

Unstructed

Matern

Factor Analysis

速度快

支持系谱

支持多性状分析

SAS

Mixed

HPMIXED

GLIMMIX

ML

REML

标准误(se

Nested

Cross

Block

NO

速度慢

支持系谱

支持多性状分析

MCMCglmm

MCMCglmm

MCMC

Credible  intervals

Nested

Cross

Block


速度慢

支持系谱

支持多性状分析

Stata

Xtmixed

Xtreg

LM

REML


Nested

Cross

Block

Unstructed




功能方法

函数

Nlme

Lme4

MCMCglmm

ASReml

Summary

Estimate

T

Df

P


Estimate

Std err

T

Df

P


Post.mean

CI

Eff.sample

Loglike

Varcomp

Std.err

Z-ratio

Constraint

Coef效应值

FixedBLUE

Ranef(BLUP)

Loglik

Plot

Predict

Ped

Intervals

Update

LRT


参考网站:

http://glmm.wikidot.com/pkg-comparison  


生物统计与数量遗传学公众号




http://blog.sciencenet.cn/blog-2577109-1007375.html

上一篇:农业鉴定数据自动化处理流程
下一篇:林木育种中数据分析的方法介绍

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-1-17 10:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部