miRNA分享 http://blog.sciencenet.cn/u/spfeng321

博文

基因的定义及结构

已有 24068 次阅读 2019-1-28 16:55 |个人分类:分子|系统分类:科研笔记

基因的结构

 

真核基因结构(图片来自百度搜索)

基因:指产生一条有功能的蛋白质或RNA所需的全部核苷酸序列。

从基因的定义来看,它包括如下几个方面:

有功能:无功能的是假基因;

基因类型:蛋白编码基因和非编码RNA基因;

核苷酸序列:大部分生物的基因是DNA序列;有些生物如RNA病毒,其基因是RNA序列。

全部:所以基因序列应该包含增强子、启动子、外显子、内含子、终止子等片段;需要注意的是一般启动子到终止子这一段序列是连续的,而增强子可能远离启动子,甚至在启动子的3’端方向,没有相关文献明确说明基因是否一定要是一段连续的序列,如果要去连续,则增强子与启动子间所有序列均看作是侧翼序列;如果不要求连续,则基因序列变为2段,启动子至终止子一段,增强子组成另一段。

开放阅读框ORFopen reading frame):是从起始密码子开始至终止密码子结束的一段DNA序列,中间不能有其他终止密码子,多是利用电脑预测基因时用的概念,是一个推测片段,任何一段序列的ORF有六种情况。

编码区CDScoding sequence):是指实际可翻译为蛋白的一段DNA/RNA序列。所以CDS是一定是ORF,但ORF不一定是CDS

内含子Intron:一段DNA或者RNA序列,在RNA成熟过程中会被剪切去除的RNA序列(或指其对应的DNA序列)。

外显子exon:一段DNA或者RNA序列,在RNA成熟过程中会保留在成熟RNA中的序列(或指其对应的DNA序列),对于蛋白编码基因来说,外显子可翻译为多肽链;内含子和外显子都是相对的,在RNA的可变剪辑中,一个剪辑体的内含子可能是另一个剪辑体的外显子,反之亦然。

UTRun-translated region):非翻译区,是蛋白编码基因成熟mRNA序列两端不能翻译为蛋白质的序列,包括5UTR3UTR,有时候也可指其对应的DNA序列。




https://blog.sciencenet.cn/blog-105435-1159542.html

上一篇:DNA与RNA的分类
下一篇:miRNA命名规则
收藏 IP: 113.56.84.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 11:28

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部