leether的个人博客分享 http://blog.sciencenet.cn/u/leether

博文

Gene Ontology(2)

已有 8460 次阅读 2011-5-2 18:03 |个人分类:生物信息学|系统分类:科普集锦| 生物信息学, gene, Ontology

上回说得很抽象,这次说得更抽象一点:)
比如说,一条狗,中国人叫“狗”,美国人叫“dog”,从没见过也没听过的,只能是“啊呀呀,一个。。,它会。。。”。同样的会我们搞生物的人来说,基础的研究对象就是“基因”,那么你怎么描述一个基因呢?最常见的是它的序列,而知道了它的序列与它的功能有什么关系呢?
研发Gene ontology的这帮专家们,就从这三个方面进行了描述:基因产物的亚细胞定位,分子功能和所参与的生物学过程。而且是跨物种的。
那么这种分析方法是否全面?是否适当?大家可以探讨。但基本上来说,知道了一个基因的这三个方面,也就基本上知道了它的功能。更进一步说,如果不描述基因的这三个方面,可能还无法准确、全面的阐述一个基因的功能呢。
其实有一些数据库(如genecards试图总结和一个基因有关的各方面的信息,OMIM是描述是描述基因与疾病的关系)提供了更多的信息。但是什么情况下要用Gene Ontology呢?
不得不提的是,这个数据库的构建中计算机专家起到了至少70%的作用,包括库的构建,以及后续库的使用。使用老的数据库的时候,计算机专家们必须听生物学家的,生物学家会根据很多年的积累告诉他们,A基因怎么样,B基因怎么样,可以看到所有经过人工注释的数据库质量是最高的。而计算机专家就是编编程序。因为他们没有这样的知识积累。但是有了Gene ontology之后,情况发生了变化,一旦对每个基因从这几个方面进行了注释,那么计算机专家就可以使用一些生物学家所不知道和不会的工具来进行数据挖掘。例如,对通过基因表达谱发现的上调的200个基因进行深入的分析中,Gene Ontology就可以起到很好的作用。我们可以看看是否有很多基因处于类似的亚细胞定位,是否都参与了某一生物学过程,是否他们的分子功能方面是互补的。这些都可以进行自动化的处理,并且得到统计学上靠得住的结果。
下回再说说其中一些比较微妙的地方。。


https://blog.sciencenet.cn/blog-396332-439607.html

上一篇:Gene Ontology(1)
收藏 IP: 123.117.71.*| 热度|

0

发表评论 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 19:42

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部