||
🙈: 禹开权
📧: 1962568272@qq.com
背景
在得到SNP位点后,我们总想知道在它附近1MB内存在哪些基因,对它进行富集分析之类。如果想要优化程序或者想要mac版本(github提供linux和windows命令行版本)请私信我邮箱,等有空补。
准备文件
GFF文件:
chr1A EVM CDS 516539 517162 . - 0 ID=CDS1.A.satnudSFS1A01G007004.1;Parent=A.satnudSFS1A01G007004.1 chr1A EVM exon 516539 517162 . - . ID=exon1.A.satnudSFS1A01G007004.1;Parent=A.satnudSFS1A01G007004.1 chr1A EVM gene 524843 526291 . + . ID=A.satnudSFS1A01G007003 chr1A EVM mRNA 524843 526291 . + . ID=A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003 chr1A EVM CDS 524843 526291 . + 0 ID=CDS1.A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003.1 chr1A EVM exon 524843 526291 . + . ID=exon1.A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003.1 chr1A EVM gene 627235 634575 . + . ID=A.satnudSFS1A01G007002
SNP位置文件:
chr1A 515678
运行软件
# linux ./snp_loc_gene -i test.gff3 -l testSnpLoc.txt -o test.out -p 2000 # windows ./snp_loc_gene.exe -i test.gff3 -l testSnpLoc.txt -o test.out -p 2000
-i : GFF file -l : SNP Location file tab符分割两列的坐标文件 -o : Output file -p : Distance from SNP to search for genes 默认1MB -m : mode of search (default: all) 基因横跨pos到远处是否保留,默认保留
结果
第一列基因ID,起始-终止,染色体,SNP的坐标
A.satnudSFS1A01G007004 515678-517162 chr1A 515678
离线版本
https://github.com/yukaiquan/snp2genes
在线版本
截止写稿时还未上线请期待:
http://www.waooat.cn/toolkit/snp2genelist/
编辑切换为居中
添加图片注释,不超过 140 字(可选)
如果是燕麦基因组在线版本不需要提供GFF文件,只需以Tab分割的SNP的坐标即可;
注意压缩文件现在还不知道为什么偶尔会读取异常,最好解压后拖入框中;
注意结果默认只展示1000行,超过1000行建议直接点击下载按钮
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-18 05:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社