raindyok的个人博客分享 http://blog.sciencenet.cn/u/raindyok

博文

PopART 绘制 Haplotype Network 图解(By Raindy)

已有 35831 次阅读 2019-7-28 19:42 |个人分类:软件教程|系统分类:科研笔记

絮语:
        重建单倍型网络是群体遗传学的一个重要分析内容,最常用的分析工具有Network、TCS等,但不同工具都有相应的优缺点,具有详见日志后的参考文献,本文不作赘述。

        本文介绍一款全能型的单倍型网络重建工具-- PopART,该软件整合了多种不同的单倍型网络重建算法,支持Windows、Linux、MacOS多平台...

        PopART 官网:http://popart.otago.ac.nz/index.shtml


辅助工具
DnaSP 和 Arlequin

简明流程:
1. 数据格式准备:

PopART 数据格式,主要有两个data和Traits模块,红色部分为主要模板参数,黑色部分需要通过实际数据修改:

Begin Data;

    Dimensions ntax=12 nchar=13;

    Format datatype=DNA missing=N gap=-;

    Matrix

单倍型数据(需要替换上实际数据)

;

END;


Begin Traits;

Dimensions NTraits=4;

format labels=yes missing=? separator=Comma;

TraitLabels Fujian Hebei Heilongjiang Jiangsu;

Matrix
单倍型频率分布数据(需要替换上实际数据)

;

End;

Raindy 注:
Data 模块中,ntax是单元类别数,nchart是字符长度,即:序列长度
Traits模块中,NTraits是性状数,示例数据为不同地区群体,共有四个;
separator是不同性状群体间的分隔符,可以是逗号也可以是Tab制表符,需要下方的数据统一。示意数据是Comma分隔;TraitLabels是具有的性状名称,不同名称之间由半角空格间隔;

(1)准备 
Haplotype 数据和频率分布数据
        将原始FASTA格式的序列文件载入DnaSP后,点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “
Update All Entries”。





        随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据
生成“Arlequin Haplotype List”文件,生成Test.arp和Test.hap 两个文件,Test.arp用Arlequin的方案文件,Test.hap为单倍型数据文件。


psb_03.png

        将Test.arp和Test.hap复制到Arlequin目录中,打开Arlequin主程序,通过“Open project”载入“Test.arp”(图)
psb_04.png

        标签切换到“Structure Edior”对不同地区的群体进行归组,示例数据的不同群体均为一个组,故“
Group”均设置为“1”,并点击“Update Project”更新项目分组内容:
psb_05.png

        标签切换到“Settings”选择不同的分析内容,可以点击“Population comparison”选项(由灰变暗红即启用),勾选“Compute pairwise Fst”选项,其他参数采用默认设置:
psb_06.png

        在生成结果文件(Test_main.html)中找到“Haplotype frequencies in populations”内容,复制不同单倍型在不同群体中的频率分布值(下图突出选中区域),粘贴入一个空的记事本中并保存为Test_frq.txt。
psb_07.png

        运行 Excel后打开Test_frq.txt通过导入向导(注意:间隔符号为空格)导入频率文件,并整理如下格式图备用(文件名:Test_frq.xlsx
psb_08.png


(2)合并单倍型数据和频率分布为PopART所需的Nexus文件
        用文本编辑类工具(如:Notepad++等)创新一个模板文件,分别在Data模块和Traits相应的位置中添加入
单倍型数据和频率分布数据,完整如下代码所示:

#NEXUS

Begin Data;

    Dimensions ntax=12 nchar=13;

    Format datatype=DNA missing=N gap=-;

    Matrix

Hap_1   TACATCAGGGTAG

Hap_2   TACATCAGGGTAC

Hap_3   TACATTAGGGTAC

Hap_4   TCCACCAGGGAAC

Hap_5   TCCATCAGGGTAC

Hap_6   TACATCAGGGTCC

Hap_7   TACAACAGCTTAC

Hap_8   TACAACAGGGTAC

Hap_9   CACCACCACGTAC

Hap_10  TATAACAAGGTAC

Hap_11  TACTTCAGGGAAC

Hap_12  TACAACAGGGAAC

;

END;


Begin Traits;

Dimensions NTraits=4;

format labels=yes missing=? separator=Comma;

TraitLabels Fujian Hebei Heilongjiang Jiangsu;

Matrix


Hap_1 10,0,0,0

Hap_2 19,9,12,10

Hap_3 1,0,0,0

Hap_4 1,0,0,0

Hap_5 1,0,0,0

Hap_6 0,0,1,0

Hap_7 0,0,1,0

Hap_8 0,0,2,0

Hap_9 0,0,1,0

Hap_10 0,0,0,7

Hap_11 0,0,0,2

Hap_12 0,0,0,1

;

End;


2. 绘制单倍型网络
        
在PopART中载入格式正确的nexus文件后,在“Network”菜单下选择一个算法,示例为“TCS Network”,此时默认生成的是黑白样式的,如下图所示:

PopART_09.png

可以在“Edit”菜单下设置包括性状颜色、标签字体和图注字体等属性:
PopART_10.png

        如果需要修改性状颜色,在右下角图注选择相应的圆圈(如:Fujian前的圆圈),鼠标右键弹出“Change trait colour”设置不同的颜色。在PopART中,很多元件(如:单倍型标签、图注和外框边界)都可以直接拖动。
PopART_11.png
        设置完毕后的Haplotype Network可以“File”菜单中导出矢量的图形,为便于后期在AI中进一步美化,推荐导出svg格式:
PopART_12.png


        以下示意为Minimum Spanning Network算法重建的单倍型网络图:

psb_13.png

Raindy注:PopART除了可以选择不同算法重建单倍型网络图外,还可以结合地图(map)进行呈现...

参考文献:
Leigh, J.W., Bryant, D., 2015. popart: full-feature software for haplotype network construction. Methods in Ecology and Evolution 6, 1110-1116.





https://blog.sciencenet.cn/blog-460481-1191502.html

上一篇:多基因联合分析简明图解之PhyloSuite篇
下一篇:应用BETS检测数据集的时间信号
收藏 IP: 112.49.210.*| 热度|

1 杨婵

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 06:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部