|||
使用R语言提取索取号
熊荣川
xiong rongchuan
六盘水师范学院生物信息学实验室
xiongrongchuan@126.com
http://blog.sciencenet.cn/u/Bearjazz
从Genbank下载的序列,通常序列较长,提取这些索取号是一件体力活,因此我们编写了下面的函数已解决此问题。
fasGBS <- function(name){
xiong = strsplit(name,'\|')
xiong = unlist(xiong)
index = grep("gb",xiong)
return(xiong[index+1])
}
使用举例:
name = ">gi|308051814|gb|GU013768.1| Rana grahami clone 162 bradykinin precursor, gene, complete cds" #genbank下载序列的fasta格式序列名称
fasGBS(name) #调用fasGBS函数
[1] "GU013768.1" #结果
就这么简单,祝您科研愉快
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-27 14:33
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社