||
基因的结构
真核基因结构(图片来自百度搜索)
基因:指产生一条有功能的蛋白质或RNA所需的全部核苷酸序列。
从基因的定义来看,它包括如下几个方面:
有功能:无功能的是假基因;
基因类型:蛋白编码基因和非编码RNA基因;
核苷酸序列:大部分生物的基因是DNA序列;有些生物如RNA病毒,其基因是RNA序列。
全部:所以基因序列应该包含增强子、启动子、外显子、内含子、终止子等片段;需要注意的是一般启动子到终止子这一段序列是连续的,而增强子可能远离启动子,甚至在启动子的3’端方向,没有相关文献明确说明基因是否一定要是一段连续的序列,如果要去连续,则增强子与启动子间所有序列均看作是侧翼序列;如果不要求连续,则基因序列变为2段,启动子至终止子一段,增强子组成另一段。
开放阅读框ORF(open reading frame):是从起始密码子开始至终止密码子结束的一段DNA序列,中间不能有其他终止密码子,多是利用电脑预测基因时用的概念,是一个推测片段,任何一段序列的ORF有六种情况。
编码区CDS(coding sequence):是指实际可翻译为蛋白的一段DNA/RNA序列。所以CDS是一定是ORF,但ORF不一定是CDS。
内含子Intron:一段DNA或者RNA序列,在RNA成熟过程中会被剪切去除的RNA序列(或指其对应的DNA序列)。
外显子exon:一段DNA或者RNA序列,在RNA成熟过程中会保留在成熟RNA中的序列(或指其对应的DNA序列),对于蛋白编码基因来说,外显子可翻译为多肽链;内含子和外显子都是相对的,在RNA的可变剪辑中,一个剪辑体的内含子可能是另一个剪辑体的外显子,反之亦然。
UTR(un-translated region):非翻译区,是蛋白编码基因成熟mRNA序列两端不能翻译为蛋白质的序列,包括5’UTR和3’UTR,有时候也可指其对应的DNA序列。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 11:28
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社