博文

GWAS分析中SNP解释百分比PVE | 第一篇，SNP解释百分比之和为何大于1？

已有 3013 次阅读 2021-12-22 19:51 |个人分类:GWAS|系统分类:科研笔记

关于GWAS分析中PVE的计算方法：

我查了一下，大体计算PVE的方法有三种：第一种回归分析或者方差分析的方法，计算R方（GLM模型），第二种是根据effect，se，maf计算PVE，第三种是根据LMM的矩阵构建计算PVE。

汇总如下：所以准备研究一下。

先看一个常见问题：GWAS分析中，SNP解释百分比（PVE）之和为何大于1？

问题来源：TASSEL的google group：

https://groups.google.com/g/tassel/c/v1aOPCYFyJE/m/HromqNnNIyMJ

问题描述：

❝
Again I have a question.

In association mapping results in Tassel by MLM model gives Marker R2
values. If Marker R2 reports proportion of phenotypic variation
(between 0 to 1) that is explained by corresponding maker, why sum of
marker R2 values for all of markers is more than 1?
❞

为何GLM或者MLM中的Marker R2之和会大于1，如果R2是解释的百分比，那应该是在0~1之间呀。

张志武老师回复：

❝
The association studies in TASSEL (MLM or GLM) are performed on markers one at a time. Therefore, the sum of the R square (R2) of markers could be bigger than 100%. One of the reasons is due to linkage disequilibrium (LD) between markers. For example, if a marker has R2 of 20% and the marker is in complete LD with other five markers, then the five markers will have R2 sum to 120%.
❞

在TASSEL中GLM或者MLM模型中，是单标记扫描，之所以SNP的R2（R square）之和会大于1，因为标记间存在LD，比如一个标记关联的基因能解释20%的变异，这个位点附近有6个标记都存在LD状态，那么这6个标记的解释百分比之和就会是120%。

下一节介绍一下GAPIT中GLM的PVE的计算方法，并用R语言实现。

转载本文请联系原作者获取授权，同时请注明本文来自邓飞科学网博客。
链接地址：https://blog.sciencenet.cn/blog-2577109-1317726.html

上一篇：TASSEL的MLM模型构建的kinship矩阵相关知识
下一篇：GWAS分析中SNP解释百分比PVE | 第二篇，GLM模型中如何计算PVE？

收藏 IP: 223.90.189.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

邓飞

扫一扫，分享此博文

育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注：生物统计，数量遗传，混合线性模型，生物信息，R，Perl，Python，GWAS，GS相关方法，文章及代码

博文

GWAS分析中SNP解释百分比PVE | 第一篇，SNP解释百分比之和为何大于1？

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

邓飞

全部作者的其他最新博文

全部精选博文导读

育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注：生物统计，数量遗传，混合线性模型，生物信息，R，Perl，Python，GWAS，GS相关方法，文章及代码

博文

GWAS分析中SNP解释百分比PVE | 第一篇，SNP解释百分比之和为何大于1？

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

邓飞

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)