||
写在前面
简单来说,数据库就是存放数据的仓库和场所,本质上也就是一个文件。一般分为内部数据库(隐秘与独享)和外部数据库(公开与共享)两种类型。在生物医学领域,建立数据库具有耗时、耗力又耗人特点,尤其是建立用户非常友好的数据库。那么,为什么要建立数据库?最简单理由是快速、方便的查找和获取自己需要的数据、信息或知识。在ceRNA研究领域,也需要数据库的帮助。在ceRNA数据库上篇,首先看看高质量的两种实验验证型数据库(miRSponge和LncCeRBase)。这种类型的数据库,里面的数据往往可以看作事实证据(Ground Truth)。
miRSponge
miRSponge(图1,http://bio-bigdata.hrbmu.edu.cn/miRSponge/)是第一个ceRNA实验验证型数据库,它从接近1000篇文献中收集了11个物种内的457条ceRNA竞争关系。这些ceRNAs有四种类型,包括lncRNAs、circRNAs、mRNAs和pseudogenes。近几年,miRSponge数据库一直都没有更新。一部分原因可能是实验验证型ceRNA竞争关系这几年没有多大增幅。
图1 miRSponge数据库主页
LncCeRBase
LncCeRBase(图2,http://www.insect-genome.com/LncCeRBase/front/)是第二个ceRNA实验验证型数据库。该款数据库比较专一,专门收集lncRNA关联的实验验证型ceRNA竞争关系。从300篇文献中,总共收集到432条lncRNA关联的ceRNA竞争关系。问题是,LncCeRBase数据库近几年也一直都没有更新!一部分原因可能是lncRNA关联的实验验证型ceRNA竞争关系这几年没有多大增幅。
图2 LncCeRBase数据库主页
虽然miRSponge和LncCeRBase这几年都没有更新,但是里面已有数据对于验证计算机预测的ceRNA竞争关系仍然有一定帮助,尤其是验证明星分子PTEN关联的ceRNA竞争关系。特别地,如果验证lncRNA关联的ceRNA竞争关系,建议融合miRSponge和LncCeRBase两个数据库里面的数据。建立生物医学数据库不容易,而且吃力不讨好,但它又是非常重要的基础任务。所以,如果使用了相关数据库,务必要引用相关参考文献。这样一来,将助力相关数据库开发者更好地维护已有数据库。
参考文献:
[1] Wang, P., Zhi, H., Zhang, Y., Liu, Y., Zhang, J., Gao, Y., Guo, M., Ning, S., & Li, X. (2015). miRSponge: a manually curated database for experimentally supported miRNA sponges and ceRNAs. Database: the journal of biological databases and curation, 2015, bav098. https://doi.org/10.1093/database/bav098
[2] Pian, C., Zhang, G., Tu, T., Ma, X., & Li, F. (2019). LncCeRBase: a database of experimentally validated human competing endogenous long non-coding RNAs. Database: the journal of biological databases and curation, 2019, baz090. https://doi.org/10.1093/database/baz090
更多背景知识如下:
3. 什么?ceRNA竞争除了“单挑”模式,还可能有“组队”模式?
4. ceRNA,是与非!
10. ceRNA工具包之SPONGE
11. ceRNA工具包之miRSM
为了便于交流,我们为ceRNA研究在Frontiers in Molecular Biosciences杂志( 2020_IF = 5.246)整了个专刊,主题为“Computational Identification of ceRNA Regulation”。投稿链接:https://www.frontiersin.org/research-topics/24340/。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-26 16:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社