育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

单性状动物模型矩阵形式计算BLUP值

已有 3835 次阅读 2018-12-21 20:49 |个人分类:数量遗传学|系统分类:论文交流

段子:

同事去大骨头, 吃过之后进行了抽奖, 然后向我炫耀, 看我抽到了一个小猪佩奇. 照片如下:

我看过之后, 冷静的说, 首先, 我们去吃饭, 奖品都是送的, 不需要抽奖的.

其次, 这是乔治, 不是佩奇.




1, 数据

这次使用一个PPT里面的数据, 用R语言演示一下如何做BLUP值计算.

下面是生成数据的代码

Chang <- c(1,1,1,2,2)
ID <- c(1,2,3,4,5)
Sire <- c(0,0,1,1,3)
Dam <- c(0,0,0,2,2)
weight <- c(140,152,135,143,160)
dat <- data.frame(Chang,ID,Sire,Dam,weight)
dat


ChangIDSireDamweight
1100140
1200152
1310135
2412143
2532160

2, 计算亲缘关系逆矩阵

library(nadiv)

提取系谱信息

ped <- dat[,2:4]

ped



IDSireDam
100
200
310
412
532

计算亲缘关系逆矩阵

pped = prepPed(ped)

pped
Warning message in prepPed(ped):
"Zero in the dam column interpreted as a missing parent"Warning message in prepPed(ped):
"Zero in the sire column interpreted as a missing parent"

首先, 将系谱进行一下转换, 使用nadiv的prepPed函数, 预处理. 它会自动不齐没有亲本的个体, 变为NA.

IDSireDam
1NANA
2NANA
31NA
412
532

如果是计算逆矩阵的矩阵形式, 可以使用makeAinv(pped)$Ainv

Ainv = makeAinv(pped)$Ainv

Ainv
5 x 5 sparse Matrix of class "dgCMatrix"

1  1.8333333  0.5 -0.6666667 -1  .
2  0.5000000  2.0  0.5000000 -1 -1
3 -0.6666667  0.5  1.8333333  . -1
4 -1.0000000 -1.0  .          2  .
5  .         -1.0 -1.0000000  .  2

如果是计算逆矩阵的行列形式, 可以使用makeAinv(pped)$listAinv

makeAinv(pped)$listAinv



rowcolumnAinv
1111.8333333
5210.5000000
6222.0000000
1031-0.6666667
11320.5000000
12331.8333333
1441-1.0000000
1542-1.0000000
16442.0000000
1752-1.0000000
1853-1.0000000
19552.0000000

教科书的结果, 两者一样

3, 构建模型

$$ y = Xb + Zu + e $$

构建固定因子矩阵

这里使用函数model.matrix构建矩阵, 比较方便

for(i in 1:4) dat[,i] <- as.factor(dat[,i])

X <- model.matrix(~Chang-1,dat)

X



Chang1Chang2
110
210
310
401
501

构建单元矩阵

Z <- diag(length(unique(dat$ID)))
Z
10000
01000
00100
00010
00001

构建y的矩阵

y <- as.matrix(dat$weight)
y
140
152
135
143
160

混合线性方程组

XpZ <- crossprod(X,Z);XpZ
Chang111100
Chang200011

X’X

XpX <- crossprod(X) ;XpX

Chang1Chang2
Chang130
Chang202

Z’X

ZpX <- crossprod(Z,X);ZpX
Chang1Chang2
10
10
10
01
01

Z’Z

ZpZ <- crossprod(Z);ZpZ
10000
01000
00100
00010
00001

X’y

Xpy <- crossprod(X,y);Xpy
Chang1427
Chang2303

Z’y

Zpy <- crossprod(Z,y);Zpy
140
152
135
143
160

K

K <- 2;K

2

LHS <- rbind(cbind(XpX,XpZ),cbind(ZpX,ZpZ+Ainv*K))
LHS
7 x 7 sparse Matrix of class "dgCMatrix"
       Chang1 Chang2                             
Chang1      3      .  1.000000  1  1.000000  .  .
Chang2      .      2  .         .  .         1  1
1           1      .  4.666667  1 -1.333333 -2  .
2           1      .  1.000000  5  1.000000 -2 -2
3           1      . -1.333333  1  4.666667  . -2
4           .      1 -2.000000 -2  .         5  .
5           .      1  .        -2 -2.000000  .  5

可以看到, 里面的LHS左手矩阵和上图结果一致.

RHS <- rbind(Xpy,Zpy)
RHS

求解BLUP值

solve(LHS)%*%RHS
7 x 1 Matrix of class "dgeMatrix"
           [,1]
[1,] 142.842105
[2,] 151.118421
[3,]  -2.462551
[4,]   3.052632
[5,]  -2.116397
[6,]  -1.387652
[7,]   2.150810


可以看到, 结果虽然结果不一致, 但是PPT里面的结果是错误的…


公众号.png



https://blog.sciencenet.cn/blog-2577109-1152899.html

上一篇:人际交往能力远比你想象的重要
下一篇:科学算命以及全基因组选择的讨论
收藏 IP: 117.119.97.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 08:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部