科学网

 找回密码
  注册
利用bioperl建立索引文件及提取序列
热度 1 闫双勇 2013-12-8 17:28
适用情形:需要从包含多个FASTA序列的文件中,根据序列名提取其中部分FASTA序列。一般情况,这个序列文件中包含的序列数量比较多,例如水稻基因组全部预测基因的序列,每个序列为一个fasta文件。主要为两步:第一步,建立索引文件。第二步,提取需要的序列。在这两步间还有一个准备步骤。 第1步的脚本文件 ...
个人分类: linux|7993 次阅读|2 个评论 热度 1
略评“种业硅谷”
闫双勇 2013-12-1 20:00
新闻链接: http://news.sciencenet.cn/htmlnews/2013/12/285692.shtm ,标题: 中国杂交水稻发源地湖南将建“种业硅谷”。呵呵,个人以为:叫所谓的“种业硅谷”,还不如叫“稻谷”。这样取名才有和硅谷齐名的机会,种业硅谷给人一种,硅谷的分支机构的感觉,干得再好也在它的阴影下笼罩。此名大不妙也!稻谷者谁欲为之? ...
个人分类: 未分类|2374 次阅读|没有评论
变异效应预测工具Variant Effect Predictor
闫双勇 2013-12-1 19:35
http://www.gramene.org/tools.html
个人分类: 技术和方法|6256 次阅读|没有评论
用cut命令从n多列中提取特定的几列
热度 1 闫双勇 2013-11-30 15:50
例如:cut -f 1,2,3,4,5,6,7,8 Cul_Wild_1529lines.chr21529snp_chr2 这个文件有1529+8=1537列,前8列如下: Chromosome Position RefBase SnpBase TotalHitNum MAF RefNum SnpNum 后1529列为不同品种在相应位置的SNP。文件Cul_Wild_1529lines.chr2的大小为2.3G,后面产生的1529snp_ch ...
个人分类: linux|17347 次阅读|3 个评论 热度 1
blast in Linux
闫双勇 2013-11-17 12:22
以前用perl 在这个ubantu系统下进行本地blast遇到点问题,本地blast database老是建不了。现在按这里 http://www.ncbi.nlm.nih.gov/books/NBK52640/ 的方法装了一个standalone BLAST.主要命令:如 tar zxvpf ncbi-blast-2.2.23-x64-linux.tar.gz。 建库用类似下面的命令: &n ...
个人分类: linux|5502 次阅读|没有评论
来自gramene的.mysqldump文件导入mysql数据中
闫双勇 2013-11-16 09:55
1 获得超级用户权限:sudo su 2 登陆到mysql mysql -u root -p 3 建立一个新的数据库如:oryza_sativa_variation_38_72_6 4 把导入mysql数据库的文件存到进入mysql系统时的目录中,如:/home/bioysy.这个是个关键 5 在mysql中运行命令use oryza ...
个人分类: DATABASES|3024 次阅读|没有评论
著名期刊中的水稻序列
热度 1 闫双勇 2013-11-16 01:54
弄了个小脚本来发现著名期刊中提交了水稻序列的文章.干这件事的本意是为了了解已经克隆的水稻基因的情况.克隆基因一般会干两件事:一是发表文章,二是提交序列.但提交序列的文章不一定都是关于基因克隆的报道.例如关于进化方面的研究,或者是研究已经克隆的基因的不同等位基因等.   ...
个人分类: 水稻基因|3371 次阅读|2 个评论 热度 1
水稻基因组参考序列版本
热度 2 闫双勇 2013-11-16 01:37
上传一个我自己整理的不同版本的水稻基因组各染色体长度分布表.这个表可以反映出这样一个问题:不同版本的全基因组序列,染色体长度是不同的,所以获取相关信息,如果涉及到在染色体的具体位置时应当留意序列版本.我在这个博客上发布过一些InDel标记,这批标记的参考基因组序列为TIGR version 5(当然现在 ...
个人分类: 多态性|9045 次阅读|3 个评论 热度 2
CRISPR系统的缺点
闫双勇 2013-11-13 04:33
http://www.biotechniques.com/news/CRISPR-Less-Reliable-Than-Alternatives/biotechniques-344342.html?utm_source=BioTechniques+Newsletters+%26+e-Alertsutm_campaign=13fa3a5901-Genomics_05122011utm_medium=emailutm_term=0_5f518744d7-13fa3a5901-86762166#.UoKO3bIcaTU 较高频率的非靶位点变异. ...
个人分类: 技术和方法|4823 次阅读|没有评论

本页有 1 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 22:56

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部