||
一份真核生物环状RNA命名指南
真核信使RNA转录本的选择性剪接通常会导致从单个基因位点产生几种成熟的RNA,包括线性RNA和环状RNA(circRNAs)。环状RNA的名称通常是模棱两可的,在研究中缺乏一致性。本次介绍的指南呼吁业界采用通用命名法来命名环状RNA,以确保清晰性和可重复性。
一个清晰的环状RNA命名系统是非常有必要的——尤其是一个能够让我们很容易知道成熟环状RNA中存在的宿主基因和确切的外显子和内含子的命名系统。然而,RNA环的命名目前超出了HUGO基因命名委员会的范围。值得注意的是,许多环状RNA已被公开可用的数据库存档,如CIRCpedia (http://yang-laboratory.com/circpedia/), circAtlas (http://159.226.67.237:8080/new/index.php), circBank(http://www.circbank.cn)和circBase(http://circbase.org)可以通过数据库条目检索。然而,在不同的数据库中使用了不同的策略来命名环状RNA,因此产生的名称通常不容易被回忆起来。举个例子,功能性的FAM120A环状RNA在CIRCpedia中称为HSA_CIRCpedia_64725,在circAtlas中称为hsa-FAM120A_0006,在circBank中称为hsa_circFAM120A_007,在circBase中称为hsa_circ_0001875(表1)。
表1 功能性的FAM120A环状RNA在每个数据库中的不同身份
为了命名由后剪接产生的环状RNA,作者们建议在前缀“circ”之后,同时包括基因符号和外显子成分的数量(如果保留在成熟转录本中,也要内含子)。这样的命名系统需要明确关于哪个线性转录本被用作参考的信息。这是因为可选的启动子、可选的剪接位点和/或可选的多聚腺苷酸信号经常导致从给定的基因位点产生各种不同的线性转录本。在这里,每个基因位点选择一个GENCODE/Ensembl转录本作为参考,如果可能,作者们建议使用标准化的参考转录本,如MANE(匹配注释来自NCBI和EMBL-EBI)转录本。为了说明这些提议的命名标准,作者们在下面提供了不同类型的环状RNA的例子(图1)。除了在未来发表的研究中使用这些名称外,还必须提供用于所有环状RNA名称的线性参考转录本(例如,当名称首次在文本或图形中使用时)。此外,应提供包括线性参考转录本(例如,类似于图1b的顶部)和基因组坐标的基因位点示意图以及组装版本。鉴于并非所有转录数据都必须永久可用,提供环状RNA的实际序列将有助于确保长期的清晰度。
第一种情况:不同BSJ位点的同一基因位点产生多个环状RNA,可以参考图1bc命名。第二种情况:BSJ相同但内部剪接模式不同的环状RNA,可以参考图1defg命名。第三种情况:含有先前未注释外显子的环状RNA,可以参考图1hi。第四种情况:来自易位基因位点的融合环状RNA,可以参考图1j。
图1 环状RNA命名标准建议
鉴于在真核细胞中观察到的环状转录本种类繁多,以及许多不同的RNA环可以从单个宿主基因中衍生出来的事实,亟需一个系统的环状RNA命名方案。为了限制歧义,作者们建议通过后剪接产生的环状RNA名称应包括前缀“circ”,后面跟着宿主基因符号和外显子(如果存在,则包含内含子)信息。类似的策略可以通过使用替代前缀“ci”来命名内含子套索衍生的ciRNA。这些命名方案是直观的,可用于命名任何真核生物物种的环状转录本。尽管如此,它们依赖于线性转录本的现有注释。因此,作者们提出的方案代表了环状RNA被纳入GENCODE和RefSeq等注释数据库之前的临时解决方案。这一步骤将是唯一真正的长期解决方案,因为它将消除circRNA名称中的歧义)例如,通过允许删除NE标签),并消除对引用线性转录本的需要。与此同时,在出版物中提供所有环状RNA名称的参考转录本是至关重要的。作者们呼吁作者、审稿人和编辑人员确保报告环状RNA的手稿需要提供:(1)基因组坐标和相关基因组组装;(2)环状RNA的完整序列;(3)任何以前给出的名字,例如在环状RNA数据库中的名字;(4)清晰的图表,以描绘出感兴趣的环状RNA在基因组中的位置。当几个环状RNA从同一基因位点产生时,这将有助于极大地促进交流和消除混乱。越来越多的环状RNA持续被识别,包括一些可能来自内含子自连接和一些来自非编码RNA(包括转移RNA、核糖体RNA和线粒体RNA。随着领域的发展,可以为这些新的转录本类提供额外的命名标准。
参考文献
[1] Chen LL, Bindereif A, Bozzoni I, et al. A guide to naming eukaryotic circular RNAs. Nat Cell Biol. 2023;25(1):1-5. doi:10.1038/s41556-022-01066-9
以往推荐如下:
2. 因果推理综述推荐一篇
5. 你想了解因果推理吗?
6. 因果学习工具:Causal Explorer和Causal Learner
7. 小样本学习
8. 样本异质性定量化
9. 生物标志物定义及其应用
13. miRNA靶基因预测工具:“我们到了哪里,又该往哪去?”
14. 人类细胞互作数据库:CITEdb
16. EMT标记物数据库:EMTome
17. EMT基因数据库:dbEMT
19. RNA与疾病关系数据库:RNADisease v4.0
20. 细胞互作网络识别方法:CINS
23. 发育、稳态和癌症中的细胞竞争
24. 单细胞组学测序在脑疾病中的应用
25. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-17 10:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社