yukaiquan的个人博客分享 http://blog.sciencenet.cn/u/yukaiquan

博文

获取SNP附近基因

已有 1516 次阅读 2023-5-31 18:47 |个人分类:OatBioDB|系统分类:科研笔记

🙈: 禹开权

📧: 1962568272@qq.com

背景

在得到SNP位点后,我们总想知道在它附近1MB内存在哪些基因,对它进行富集分析之类。如果想要优化程序或者想要mac版本(github提供linux和windows命令行版本)请私信我邮箱,等有空补。

准备文件

GFF文件:

chr1A	EVM	CDS	516539	517162	.	-	0	ID=CDS1.A.satnudSFS1A01G007004.1;Parent=A.satnudSFS1A01G007004.1
chr1A	EVM	exon	516539	517162	.	-	.	ID=exon1.A.satnudSFS1A01G007004.1;Parent=A.satnudSFS1A01G007004.1
chr1A	EVM	gene	524843	526291	.	+	.	ID=A.satnudSFS1A01G007003
chr1A	EVM	mRNA	524843	526291	.	+	.	ID=A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003
chr1A	EVM	CDS	524843	526291	.	+	0	ID=CDS1.A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003.1
chr1A	EVM	exon	524843	526291	.	+	.	ID=exon1.A.satnudSFS1A01G007003.1;Parent=A.satnudSFS1A01G007003.1
chr1A	EVM	gene	627235	634575	.	+	.	ID=A.satnudSFS1A01G007002

SNP位置文件:

chr1A	515678

运行软件

# linux
./snp_loc_gene -i test.gff3 -l testSnpLoc.txt -o test.out -p 2000
# windows
./snp_loc_gene.exe -i test.gff3 -l testSnpLoc.txt -o test.out -p 2000

-i : GFF file -l : SNP Location file tab符分割两列的坐标文件 -o : Output file -p : Distance from SNP to search for genes 默认1MB -m : mode of search (default: all) 基因横跨pos到远处是否保留,默认保留

结果

第一列基因ID,起始-终止,染色体,SNP的坐标

A.satnudSFS1A01G007004	515678-517162	chr1A	515678

离线版本

https://github.com/yukaiquan/snp2genes


在线版本

截止写稿时还未上线请期待:

http://www.waooat.cn/toolkit/snp2genelist/

编辑切换为居中

添加图片注释,不超过 140 字(可选)

如果是燕麦基因组在线版本不需要提供GFF文件,只需以Tab分割的SNP的坐标即可;

注意压缩文件现在还不知道为什么偶尔会读取异常,最好解压后拖入框中;

注意结果默认只展示1000行,超过1000行建议直接点击下载按钮





https://blog.sciencenet.cn/blog-3462946-1390079.html

上一篇:燕麦基因组浏览器Jbrowse2使用
下一篇:燕麦属基因组序列截取
收藏 IP: 183.220.124.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-18 05:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部