zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

你研究的“microRNA”可能不是microRNA

已有 474 次阅读 2025-1-1 08:11 |个人分类:科普|系统分类:科普集锦

你研究的“microRNA”可能不是microRNA 

MicroRNAmiRNA)是RNA诱导沉默复合体(RISC)的靶特异性组分。除了少数例外,它们是由初级转录本处理产生的,包括由内切酶Drosha识别和切割细胞核中的前体RNA以产生发夹pre-miR,然后由Dicer在细胞质中切割,产生接近22 nt的线性RNA,并将其装载到ArgonauteAGO)蛋白中。在人类中,有4AGO蛋白具有很高的序列相似性,其中AGO2在大多数组织中最为丰富。MicroRNA作为目标识别序列,将AGO结合到mRNA3 ‘UTR上,主要通过种子区的碱基配对,包括miRNA 5 ’端的2-8核苷酸。

已经发现microRNA影响细胞分化和功能的许多方面,并且在许多类型的癌症中作为癌基因或肿瘤抑制因子。它们在上皮向间充质转化(epithelial to mesenchymal transitionEMT)的控制中发挥着重要作用,这与癌症转移和化疗耐药有关。 然而,许多被命名为“microRNA”的小RNA的鉴定有效性也出现了问题。例如,在线数据库miRBasehttp://www.miRBase.org)列出了超过2700个人类miRNA,然而更严格的存储库MirGeneDB列出了不到600个高置信度人类miRNA 

最近,Orang等人鉴定了几十种miRBase列出的小RNA,它们不结合AGO,因此不具有miRNA功能。尽管有数百篇出版物报道了它们在EMT/或癌症中的作用。通过比较这些非miRNA与真正miRNA的特征,描述了外源表达实验的误解如何可能导致这些相互矛盾的发现,并提供了一系列实验和生物信息学标准,可用于帮助区分功能性miRNA与被误认为是miRNA的外源性RNA片段。 

该项研究将AGO关联(miRNA功能的一个关键特征)作为分离真实和错误注释的miRNA的手段。通过这样做,确定了在EMT上下文中表达的27“non-miR”,并注意到数百个出版物中他们的特征(图1)。然而,这是一个相当低估的问题,因为只能评估表达高于一定水平的miRNA,并且大多数miRBase列出的miRNA不符合这个表达阈值(无论是在这里,还是在大多数其他情况下)。因此,强烈怀疑会有其他的,可能是数百种,被赋予miRNA状态的“non-miR”,但它们不结合AGO,或者没有达到足以实现内源性功能的表达水平。Kilikevicius等人已经很好地描述了考虑miRNA和靶点的相对细胞水平的需要,以及在分配miRNA功能时应考虑的其他问题。 

image.png 

1 一小部分带注释的microRNA不结合AGO蛋白 

考虑到这一点,并考虑到miRNA过表达实验的解释问题,癌症研究界需要在开展新研究时利用控制良好的miRNA抑制实验作为一线证据。理想情况下,AGO共沉淀实验也会进行,以建立AGO关联,但即使他们从来没有,涉及miRNA抑制剂的实验是确定内源性miRNA是否真实且功能重要的第一步。 有趣的是,大多数“non-miR”仅在细胞系和组织中以相对较低的水平表达,这意味着即使它们能够结合AGO或显示与miRNA功能一致的其他特征,仅表达水平可能会排除内源性影响。这也是将内源性功能作为首要原则,通过早期实施miRNA抑制来实现的另一个原因,将极大地改善被夸大miRNA功能的主张所困扰的癌症领域。 

虽然人们认识到,人类miRNA的真实数量可能远远少于被称为“miRNA”的几千个,但仍有论文错误地将miRNA的功能归因于非miRNA。例如,在过去的两年里,有20篇论文报道了miR-663amiR-663b的作用,其实它们是“non-miR”。这可能部分是由于缺乏明确的指南来识别哪些先前注释的miRNA实际上不是miRNA,尽管MirGeneDB数据库是一个很好的起点,可以检查有问题的miRNA是否具有miRNA预期的长度和前体特征。这些标准与体内RISC复合体中miRNA的存在以及内源性miRNA抑制报告基因表达的能力密切相关。 

虽然大多数miRNA是通过典型通路产生的,包括DroshaDicer的前体切割,但也有例外,这使得与AGO结合而不是生物发生模式或加工所需的结构特征成为更有用的miRNA状态标准。例如,miR-451的产生不依赖于Dicer,但需要AGO2切割,然后进行额外的核苷酸修剪。在依赖于DroshaDicermiR-486-5p的产生过程中,也需要AGO2来切割。与Drosha无关、依赖DicermiRNA也存在,包括5 ‘端覆盖的miRNA,其5 ’端对应于转录起始位点,以及非规范生物发生需要剪接体的miRtron。此外,至少一些较大的ncRNA也编码真正的AGO结合的smRNA,这些smRNAmiRNA通路中起作用,因此miRNA和另一类非编码RNA之间重叠的基因组注释不足以降低miRNA的地位。它们可以由snoRNArRNAtRNA以典型的Dicer依赖方式产生。 

不确定性也可能来自小RNA,它们满足人们对miRNA的一些标准,但不是全部。例如,如果一个小RNAAGO的相互作用很差,它可能仍然能够抑制目标基因,但可能比人们从表达程度上预期的效率要低。这可能是因为新的miRNA不太可能从单一的进化事件中出现,从而导致所谓的过渡性miRNA”,小RNA在进化成类似miRNA活性的过程中,其基因沉默作用仍然有限。例如,在miR-221miR-148的情况下,它们与AGO共沉淀的程度只是适度的,尽管两者都是高表达的,因此代表了AGO丰富的miRNAome的重要部分。其他更低表达的RNA,以同样适度的效率共沉淀,其意义更值得怀疑。因此,边缘”miRNA(除了真实的和错误注释的清单),它们具有一些(但不是全部)人们期望的有效的、进化优化的miRNA特征。 

并非所有miRBase v22条目都是真实的,miRBase v22采用了文本挖掘方法来提高对所列miRNA功能的信心,出版物中包含miRNA名称的句子,并为与功能相关的术语(如表达目标调节抑制)共存给予正分数。然而,如果存在非内源性小RNA作为miRNA,但基于外源性表达和/或对涉及单个或控制不良的miRNA抑制剂实验的错误解释而被报道为miRNA,则这是有问题的。重要的是,即使是没有在基因组中编码的miRNA大小的序列,在短暂表达时仍然可以表现得像miRNA一样。有报道称,miRNA通过过表达显示出明显的功能,从而重申了它们在miRBase中的列表,这反过来又使未来的研究人员更有可能进行类似的实验。这种循环逻辑导致了数千篇涉及虚假“miRNA”的出版物,包括在癌症领域,这种虚假报道是数千篇癌症出版物的基础。 

参考文献

[1] Ayla Orang, Nicholas I Warnock, Melodie Migault, B Kate Dredge, Andrew G Bert, Julie M Bracken, Philip A Gregory, Katherine A Pillman, Gregory J Goodall, Cameron P Bracken. Chasing non-existent “microRNAs” in cancer. bioRxiv 2024.12.05.626946; doi: https://doi.org/10.1101/2024.12.05.626946 

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1466883.html

上一篇:MirGeneDB 3.0:miRNA家族和序列数据库
下一篇:FedPyDESeq2:转录组数据差异表达分析的联邦框架
收藏 IP: 39.128.49.*| 热度|

1 许培扬

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2025-1-4 10:39

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部