||
随着生命科学的发展,人们越来越关注基因或调控元件的物种间保守性,如何获取这些同源序列则成为生物信息学分析的常见内容。现将这方面的经验总结如下,希望对大家有所帮助!
图文并茂版,请下载:
纯文字版:
>gi|341926217|ref|NR_040616.1| Musmusculus RIKEN cDNA A130077B15 gene (A130077B15Rik), long non-codingRNA
第一步:根据NR_040616找到该基因在小鼠(mm9)中的基因组位置:
RefSeq Gene A130077B15Rik RefSeq: NR_040616.1 Status: Predicted |
mRNA/Genomic Alignments
BROWSER | SIZEIDENTITY CHROMOSOME STRAND START END QUERY START END TOTAL
-----------------------------------------------------------------------------------------------------
browser | 2547 100.0% 10 - 122002079 122006947 NR_040616 1 2547 2547
View details of parts of alignment within browser window.
Position: chr10:122002079-122006947
Band: 10qD2
Genomic Size: 4869
Strand: -
Gene Symbol: A130077B15Rik
第二步:利用该位置(chr10:122002079-122006947)在人的基因组中寻找同源序列
网站:http://genome.ucsc.edu/cgi-bin/hgLiftOver
点击Submit?
点击View conversions
会下载一个后缀为bed的文件,用文本打开,后有一个位置,即该基因在人类基因组中的同源序列的位置:chr12 63451868 63452768
第三步:根据位置查看其在人类基因组的情况:
网址:
点击submit,结果发现该区域在人类中并无基因
把当前窗口放大十倍后,会在附近找到一个Ensemble基因:
EnsemblGenes (ENST00000553036 - Ensembl 75)
Ensembl Gene Link: ENSG00000257664 Links to sequence:
|
提示是一个假基因。
第四步:获取人类同源的序列:
位置:chr12 63451868 63452768
首先提交位置:
将以上位置粘贴到上面的框中,物种选择hg19
点击Start
在窗口右侧会出现刚刚输入的位置:
获取同源序列:点击左侧的工具条:
默认输入了最新导入的位置:
点击Execute,结果在右侧结果框展示:
点击保存按钮下载序列即可:
>hg19_chr12_63451868_63452768_+ 63452768
GACTTATGGTGAAAGCTGAGTGTAGGCAAATCCTGGCTTGGGGCATGATG
GTGAGAGCAGGGGTGATTGGGGACTGGAGAAGAAACTTTGAGcatgtatt
ctcaactagggcaatcttgcccccagtggggcgaaacttggttgatgaaa
ctaggaggcaaaaatacctcattctttatgcataggcacagatatacagt
atatctattgtattaaaatattatgagagtgatgattagtaaaaaatgtc
taaaaggctggtgggaggtggaggccgtaatgaagaaaggttaagaGGTA
GTGACTGAGAGGAAAAGTAGTTCTTCACAAGGCACTCAGCTGCCTAGAAA
TGACCCAATTTAAGAACCTCTGTTCTTAAAAAGGGAAATATTCATTTTTA
AAGGATATTTCCAATGATAGTCCTTTGGAGTGGAGGTTATAGAATAAGTT
TCTCTCATTTTCTTTTCTACATCTACCTTTCTAGGATTTCCAGCACAGAG
TACAGCACAGGATAAAGGTCTGAATCAGAAATGACAGCCTGCTTATATTT
GTGAAAAGTTAAATTAGGCTTTGAAATGATGACCAGCATCATTGTTGATG
AGACGACAATGTAGattcattggcatctattacatgttaggtactttgtc
tatggttaccaccttagttaacataaccaccctgcagaataggtatatta
tccccagctaagcagcaattatgtgccgaaccagaatgtgaacccaggtc
tgtgtgactctcaaggagatacactttccactggaccacaccattcctcA
TGAAGCAAACAGTTCAGATGAAGGGTCCCTGGAAAGCCCTCTTGTTCCTT
ACAGAAGGTTTTTGCTTCTCTGGAGTTTTGACCTTGGATGCTCCTTTAGG
至此就对小鼠基因组的一个lncRNA在人类基因组中的同源性进行了分析,可以利用这些信息研究其在人类同源序列上的调控等等。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 19:06
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社