||
絮语:
重建单倍型网络是群体遗传学的一个重要分析内容,最常用的分析工具有Network、TCS等,但不同工具都有相应的优缺点,具有详见日志后的参考文献,本文不作赘述。
本文介绍一款全能型的单倍型网络重建工具-- PopART,该软件整合了多种不同的单倍型网络重建算法,支持Windows、Linux、MacOS多平台...
PopART 官网:http://popart.otago.ac.nz/index.shtml
辅助工具:DnaSP 和 Arlequin
简明流程:
1. 数据格式准备:
PopART 数据格式,主要有两个data和Traits模块,红色部分为主要模板参数,黑色部分需要通过实际数据修改:
Begin Data;
Dimensions ntax=12 nchar=13;
Format datatype=DNA missing=N gap=-;
Matrix
单倍型数据(需要替换上实际数据)
;
END;
Begin Traits;
Dimensions NTraits=4;
format labels=yes missing=? separator=Comma;
TraitLabels Fujian Hebei Heilongjiang Jiangsu;
Matrix
单倍型频率分布数据(需要替换上实际数据)
;
End;
Raindy 注:
Data 模块中,ntax是单元类别数,nchart是字符长度,即:序列长度
Traits模块中,NTraits是性状数,示例数据为不同地区群体,共有四个;separator是不同性状群体间的分隔符,可以是逗号也可以是Tab制表符,需要下方的数据统一。示意数据是Comma分隔;TraitLabels是具有的性状名称,不同名称之间由半角空格间隔;
(1)准备 Haplotype 数据和频率分布数据
将原始FASTA格式的序列文件载入DnaSP后,点击菜单栏“Data”的“Defined Seeuence sets”对序列根据特定的性状进行分组(图1),示例数据根据地区分组,分组完毕 “Update All Entries”。
随后,依次点击菜单栏“Generate”->“Haplotye data file”将分组后的数据生成“Arlequin Haplotype List”文件,生成Test.arp和Test.hap 两个文件,Test.arp用Arlequin的方案文件,Test.hap为单倍型数据文件。
将Test.arp和Test.hap复制到Arlequin目录中,打开Arlequin主程序,通过“Open project”载入“Test.arp”(图)
标签切换到“Structure Edior”对不同地区的群体进行归组,示例数据的不同群体均为一个组,故“Group”均设置为“1”,并点击“Update Project”更新项目分组内容:
标签切换到“Settings”选择不同的分析内容,可以点击“Population comparison”选项(由灰变暗红即启用),勾选“Compute pairwise Fst”选项,其他参数采用默认设置:
在生成结果文件(Test_main.html)中找到“Haplotype frequencies in populations”内容,复制不同单倍型在不同群体中的频率分布值(下图突出选中区域),粘贴入一个空的记事本中并保存为Test_frq.txt。
运行 Excel后打开Test_frq.txt通过导入向导(注意:间隔符号为空格)导入频率文件,并整理如下格式图备用(文件名:Test_frq.xlsx)
(2)合并单倍型数据和频率分布为PopART所需的Nexus文件
用文本编辑类工具(如:Notepad++等)创新一个模板文件,分别在Data模块和Traits相应的位置中添加入单倍型数据和频率分布数据,完整如下代码所示:
#NEXUS
Begin Data;
Dimensions ntax=12 nchar=13;
Format datatype=DNA missing=N gap=-;
Matrix
Hap_1 TACATCAGGGTAG
Hap_2 TACATCAGGGTAC
Hap_3 TACATTAGGGTAC
Hap_4 TCCACCAGGGAAC
Hap_5 TCCATCAGGGTAC
Hap_6 TACATCAGGGTCC
Hap_7 TACAACAGCTTAC
Hap_8 TACAACAGGGTAC
Hap_9 CACCACCACGTAC
Hap_10 TATAACAAGGTAC
Hap_11 TACTTCAGGGAAC
Hap_12 TACAACAGGGAAC
;
END;
Begin Traits;
Dimensions NTraits=4;
format labels=yes missing=? separator=Comma;
TraitLabels Fujian Hebei Heilongjiang Jiangsu;
Matrix
Hap_1 10,0,0,0
Hap_2 19,9,12,10
Hap_3 1,0,0,0
Hap_4 1,0,0,0
Hap_5 1,0,0,0
Hap_6 0,0,1,0
Hap_7 0,0,1,0
Hap_8 0,0,2,0
Hap_9 0,0,1,0
Hap_10 0,0,0,7
Hap_11 0,0,0,2
Hap_12 0,0,0,1
;
End;
2. 绘制单倍型网络
在PopART中载入格式正确的nexus文件后,在“Network”菜单下选择一个算法,示例为“TCS Network”,此时默认生成的是黑白样式的,如下图所示:
可以在“Edit”菜单下设置包括性状颜色、标签字体和图注字体等属性:
如果需要修改性状颜色,在右下角图注选择相应的圆圈(如:Fujian前的圆圈),鼠标右键弹出“Change trait colour”设置不同的颜色。在PopART中,很多元件(如:单倍型标签、图注和外框边界)都可以直接拖动。
设置完毕后的Haplotype Network可以“File”菜单中导出矢量的图形,为便于后期在AI中进一步美化,推荐导出svg格式:
以下示意为Minimum Spanning Network算法重建的单倍型网络图:
Raindy注:PopART除了可以选择不同算法重建单倍型网络图外,还可以结合地图(map)进行呈现...
参考文献:
Leigh, J.W., Bryant, D., 2015. popart: full-feature software for haplotype network construction. Methods in Ecology and Evolution 6, 1110-1116.
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-9 21:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社