|||
RAiSD:用于选择性扫描检测的软件
这个软件2018年在nature communication上发的,大家可以参考。
Input file:当前的RAiSD版本可以处理Hudson的ms或VCF(变体调用格式)文件格式的SNP数据。
Output file : RAiSD生成两个输出文件,RAiSD_Info和RAiSD_Report,其运行名称(通过“-n”提供)作为文件扩展名。
RAiSD_Info文件提供与执行和数据集相关的信息(命令行,样本数,区域大小,数据集格式),以及输入文件中每个SNP设置的结果行。 每个每组结果行提供以下信息:a)设置索引,b)站点数量,c)SNP数量,d)区域大小,e)最佳得分位置以及形成的每个因素的相应得分 μ统计量,表示为VAR,SFS和LD,以及f)最佳得分位置和μ统计量的相应得分(MuStat)
RAiSD, Raised Accuracy in Sweep Detection Copyright (C) 2017, and GNU GPL'd, by Nikolaos Alachiotis and Pavlos Pavlidis Contact n.alachiotis/pavlidisp at gmail.com Command: ./RAiSD -n test_run -I d1/msselection1.out -L 100000 -f Samples: 20 Region: 100000 bp Format: ms A pattern structure of 65536 patterns (max. capacity) and approx. 1 MB memory footprint has been created. 0: Set 0 | sites 6300 | snps 6300 | region 100000 - Var 53090 8.400e-04 | SFS 12005 1.000e+00 | LD 38385 1.333e+00 | MuStat 49905 3.908e-04 1: Set 1 | sites 6296 | snps 6296 | region 100000 - Var 49665 1.970e-03 | SFS 3745 1.000e+00 | LD 46945 2.000e+00 | MuStat 49685 8.320e-04 2: Set 2 | sites 6109 | snps 6109 | region 100000 - Var 50835 1.890e-03 | SFS 42100 1.000e+00 | LD 89390 1.500e+00 | MuStat 50770 6.825e-04 3: Set 3 | sites 6052 | snps 6052 | region 100000 - Var 49590 1.880e-03 | SFS 5545 1.000e+00 | LD 22460 1.500e+00 | MuStat 50150 1.102e-03 4: Set 4 | sites 6184 | snps 6184 | region 100000 - Var 51920 3.020e-03 | SFS 26445 1.000e+00 | LD 55080 1.333e+00 | MuStat 52400 1.180e-03 5: Set 5 | sites 5519 | snps 5519 | region 100000 - Var 49310 1.660e-03 | SFS 5475 1.000e+00 | LD 42490 1.333e+00 | MuStat 47165 8.925e-04 6: Set 6 | sites 6052 | snps 6052 | region 100000 - Var 49640 1.700e-03 | SFS 9090 1.000e+00 | LD 61435 1.250e+00 | MuStat 48080 6.200e-04
RAiSD_Report.test_run
RAiSD_Report.test_run文件的前20行如下所示(使用-R在报告文件中包含其他信息)。
// 0 430 20 840 1.640e-04 2.800e-01 2.580e+00 1.185e-04 445 20 870 1.700e-04 2.600e-01 2.500e+00 1.105e-04 450 20 880 1.720e-04 2.600e-01 2.077e+00 9.288e-05 455 20 890 1.740e-04 2.800e-01 2.210e+00 1.077e-04 460 20 900 1.760e-04 2.800e-01 2.071e+00 1.020e-04 480 30 930 1.800e-04 2.800e-01 2.097e+00 1.057e-04 490 30 950 1.840e-04 2.600e-01 1.667e+00 7.973e-05 500 40 960 1.840e-04 2.600e-01 1.113e+00 5.324e-05 515 50 980 1.860e-04 2.800e-01 8.798e-01 4.582e-05 550 110 990 1.760e-04 2.800e-01 9.087e-01 4.478e-05 565 120 1010 1.780e-04 2.800e-01 9.688e-01 4.828e-05 585 150 1020 1.740e-04 2.800e-01 1.308e+00 6.371e-05 595 170 1020 1.700e-04 2.800e-01 1.687e+00 8.031e-05 600 170 1030 1.720e-04 2.800e-01 1.595e+00 7.683e-05 605 180 1030 1.700e-04 3.000e-01 1.352e+00 6.897e-05 625 190 1060 1.740e-04 3.000e-01 1.356e+00 7.077e-05 650 240 1060 1.640e-04 3.000e-01 1.080e+00 5.315e-05 665 260 1070 1.620e-04 3.000e-01 7.723e-01 3.753e-05 670 270 1070 1.600e-04 2.800e-01 7.634e-01 3.420e-05
mkdir RAiSD cd RAiSD wget https://github.com/alachins/raisd/archive/master.zip unzip master.zip cd raisd-master make
测试运行
wget 139.91.162.50/raisd_data/d1.tar.gz tar -xvzf d1.tar.gz ./RAiSD -n test_run -I d1/msselection1.out -L 100000
这个软件很简单就完成了安装及测试,接下来可以用自己的数据 进行分析。
参考文献:
https://www.nature.com/articles/s42003-018-0085-8
https://github.com/alachins/raisd/blob/master/README.md
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-4 20:44
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社