育种数据分析之放飞自我分享 http://blog.sciencenet.cn/u/yijiaobai 关注:生物统计,数量遗传,混合线性模型,生物信息,R,Perl,Python,GWAS,GS相关方法,文章及代码

博文

双标图GGE分析在农作物品种多点试验中的应用(综述)

已有 4905 次阅读 2016-1-7 09:39 |个人分类:农学统计|系统分类:论文交流


杂志:作物学报

发表单位:加拿大农业部加东粮油中心

发表时间:20108

双标图经常用于农作物多点试验的数据分析,严威凯老师开发了一个名为GGE-biplot的软件,但软件没有相关的使用教程,操作不便,GenStat软件完全可以实现它的功能。本次文献解读介绍怎么用GenStat实现GGE双标图。

双标图应用领域:

l  品种——环境两向表

l  做基因表达数据

l  QTL效应——环境两向表

l  品种——性状两向表

l  双列杂交两向表

l  寄主——病原物两向表

l  基因型——遗传标记数据

l  环境条件——作物性状两向表

l  试验地点——气候土壤因素两向表

数据:论文中的原始数据,来源于1993年安大略冬小麦区试试验的数据,18个小麦品种在9个环境中的产量表现。第一列是18个小麦品种,第一行是9个不同的环境。

图:01

文章中有四个双标图,下面讲解怎么通过GenStat来达到相同的效果

1Which-Won-Where View,哪个品种哪个环境中是最好的

2Environmental VectorView,环境之间的关系

3DiscriminatingAbility VS Representativeness View,区分力和代表性

4Mean vs StabilityView,高产性和稳产性

它可以解决品种生态区划分、品种评价和试验点评价这三大问题。

GenStat具体实现如下:

首先对数据进行整理,数据分为三列内容:品种名、环境和产量三部分内容。

02


Ø  Which-Won-Where View,就是哪个品种哪个环境中是最好的

对应GenStat模型:

03


结果:

04


结果解读:

这张图主要是按照品种与环境的互作来说明各地点产量最高的品种。

1、  把各个方向上距离最远的点用直线连接起来,比如G8~G18~G7~G12~G13构成了一个五边形,通过中心对五条边做五条垂线,将双标图分为五个扇区,品种在五个扇区都有分布,品种分为两个扇区,E5E7为一组,其它为一组。

2、  这张图可以得出:位于五边形顶角的品种是扇区内个环境下产量最高的品种,比如G18在环境E5E7产量最高,品种G8在另外7个试验点产量最高。

Ø  Environmental Vector View,环境之间的关系

对应GenStat模型如下:将产量(value)导入到Y-variate框中,将品种(cul)导入到Genotype框里面,将环境(env)导入到Environments框里面,在Options里面勾选Connect environment scores with origin

05


作图如下:

06


结果解读:

1、  本图主要是分析各试验点之间在品种评价上的相似性。从中心到各个环境做一条线段,线段间的夹角和线段本身的长度都有一定的代表意义。

2、  两环境线段之间的夹角的余弦值是它们的相关系数,夹角小于90度表示正相关,说明两环境对品种排序相似,大于90度表示负相关,表示两环境对品种排序相反,等于90度说明两环境不相关。夹角较小说明试验点是重复设置的,去掉一个不影响对品种的评价。

3、  环境线段的长度是试验点对品种的区分能力,线段越长,区分能力越强。

4、  本图可以知道环境E1E2E3E4存在正相关。E5E7比其它点有较强的品种区分能力。

Ø  Discriminating Ability VS Representativeness View,区分力和代表性

理想的试验点应该具备两个条件:一是对参试品种有较强的区分能力(线段长),二是对目标生态区有较强的代表性。

GenStat模型如下:

07


图形如下:

08


本图一个显著的特征是它增加了两条直线,其中带箭头的直线为平均环境轴(Average Environment Axis),通过平均环境(箭头前面的圆圈)和中心点的连线。

结果解读:

1、  试验点线段和平均环境轴的角度是其对目标环境的代表性的度量,角度越小,代表性越强。如果一个试验点和平均环境轴夹角为钝角,则它不适合作为试验点。

2、  平均环境轴上箭头所指的方向是对试验点区分力和代表性两方面的评价。

3、  就区分力来说,E5E7(线段最长)最好,就代表性而言,E1E2E3E4最好(与平均轴夹角最小)。

4、  没有区分能力的试验点是无用的。

5、  有区分力但没有代表性的试验点可以淘汰不稳定的品种,但不能用于优良品种的选择。

6、  只有既有区分力又有代表性的试验点才能最好的选择高产稳产的品种。因此这张图是对试验点的一个综合评价。

Ø  Mean vs Stability View,即高产性和稳产性

GenStat模型如下:

09


作图如下:

10


结果解读:

1、  高产稳产功能图也需要环境平均轴(带箭头的直线),和平均环境值(直线上圆圈表示)。还有一条通过中心与环境平均轴垂直的直线。将品种点和平均环境轴做一条垂线。

2、  环境平均轴所指的方向是品种在所有环境下的近似平均产量的走向。可知G8平均产量株高,后面依次是G4G10G18,产量最低的是G12,后面依次是G14G7G13。品种G17的平均产量接近试验总平均。

3、  通过中心(原点)与平均轴垂直的线代表各品种与各环境相互作用的倾向性。品种与平均环境轴之间的垂线越长,表示品种越不稳定。可知G13(线段最长)最不稳定,其次是G8G17G7。比较稳产的是G12G15G16G6G4(与平均环境轴的垂线较短)。

4、  综合品种产量和稳定的指标,可以看出G4是一个比较高产稳产的品种,G8也高产,但是不稳产。虽然G12很稳产(它几乎就在平均环境轴上面),但是产量最低。

GGE双标图存在的问题:

双标图GGE是基于传统的固定效应模型,它有一些假定和局限性:

1、  它要求数据平衡,即不能存在缺失值。

2、  它要求各试验点各区组内条件完全一致。在区组较大时(如大于10个区组),假定很难实现。

3、  固定效应模型假定各试验环境的误差同质

解决方法:

1、  用混合线性模型或析因设计(FA),将品种当成随机效应,可以解决以上问题。

2、  先用随机效应模型估计出各品种在各环境下的无偏估计值(BLUP),将BLUP值代替各环境品种的平均值作为基本数据进行GGE分析。

GenStat软件中GGE的优势

1、  GenStat基于REML的混合线性模型可以将品种当成随机效应。

2、  GenStat可以计算品种的BLUP值和BLUE值。

GenStat其它类型的GGE图:




如果想咨询数据分析问题或服务,加微信JoinVSNC



https://blog.sciencenet.cn/blog-2577109-948673.html

上一篇:SAS、SPSS、R和GenStat分析裂区试验数据 代码、模型干货分享
下一篇:QTL与环境互作 文献解读
收藏 IP: 111.202.84.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 19:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部