|||
本文转载自嘉因微信公众号,已获得授权。查看最新文章,敬请关注嘉因,微信ID:rainbow-genome
作者:小哈 来源:嘉因
同一miRNA家族的miRNA拥有共同的种子seed序列,分享共同的靶基因(不完全相同),因此,研究miRNA与protein-coding gene、lncRNA、circle RNA的调控关系时,都要check一下同一family的miRNA。
怎么知道谁和谁是一家?当然要查最权威的miRBase。
研究miRNA,大家都知道miRBase数据库,不仅有序列和位置信息,还能下载miRNA family,即miRNA家族信息。
下载miFam.dat文件,用记事本或写字板可以打开,推荐用Notepad++,文件长这样:
先有一行miRNA family ID,例如mir-17,下面都是mir-17家族成员。接下来是下一个家族名字及其成员。
我研究的是人的miRNA,只对人的成员感兴趣,需要按照家族把成员提取出来。小哈把人、小鼠、果蝇、线虫的家族整理好了,每个物种一个文件。
例如,人的miRNA(前两列)都属于哪个家族(后两列),一目了然:
被这篇帖子生信入门路 | 生物/医学人的生信启蒙忽悠入坑生信的小朋友,试着自己提取:
不懂生信,不装Linux,也能Run代码—Windows系统的Linux命令行工具Babun
在Babun里,运行下面的代码:
awk '{if($1=="AC"){ac=$2};if($1=="ID"){id=$2};if($1=="MI"){split($3,a,"-");if(a[1]=="hsa"){print $2,$3,ac,id}}}' miFam.dat >hsa.mir.txt
注意:复制粘贴的时候引号可能会变,如果变了,要把引号改回英文半角。
Have Fun ~
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 15:19
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社