tianyizhang6的个人博客分享 http://blog.sciencenet.cn/u/tianyizhang6

博文

生物数据的采集对基因网络研究的影响 精选

已有 7578 次阅读 2009-12-6 09:08 |个人分类:分子遗传|系统分类:论文交流| 复杂网络

      

周涛倡议成立复杂网络圈时,我没事找事顶了一把。现在圈子成立了,我也应该履行一下基本的义务,写篇博文庆贺一下。

 我是做实验生物学的,具体说,是果蝇遗传学,所以和复杂网络圈很难联系上。基础遗传学和理论物理或者数学关联不大,而且研究方法和思维方式也完全不一样,但我认为它们有一个共同点,那就是这些学科都追求结果的“简单、漂亮”。做果蝇遗传的人都想知道某个基因在特定的时间、特定的细胞里表现出的特定而且显著的功能。所以我们做的事情通常是:这个基因突变后,会让这个细胞的分化分裂改变?它突变以后,主要影响那些下游基因的表达?有哪些上游基因调节它?突变AB基因没有表型,但它们同时突变后,会不会表型?

 得到简单而漂亮的结果是很令人赏心悦目的,这也是我的研究动力之一。研究动力之二当然就是养家糊口了。进入这个领域两年以后,做出了一些东西,也发了文章,觉得自己对果蝇遗传已经不是门外汉了。但后来我也发现这个领域也面临的一个比较严峻的问题。那就是,突变后有显著表型的基因已经基本被发现和研究过了。要有重大发现,除了绞尽脑汁、勤奋工作以外,还得很靠运气。所以如果还想在这个领域混,我要做好啃硬骨头的打算。可啃的硬骨头主要包括以下几块:1寻找那些被我们忽视掉的表型。有些果蝇的突变体看起来是正常的,但其实不然。譬如有的果蝇视力下降、睡眠不佳、容易郁闷、性功能不全、怕冷怕热、心率不齐,都是不容易被发现的,得发明一些特定的观测方法来做进一步的研究;2寻找基因余(redundancy)的原因。有些生物功能是由两个或几个结构相似或功能相似的基因控制的,突变一个基因不会表现出明显的功能缺陷,得把相关的余基因也突变掉,才会有表型;3)结合现代化的分子生物学和系统生物学的方法,研究在遗传学方法操纵下的活体细胞基因的表达谱,寻找与细胞生理过程有关的基因网络调节。这个方向应该算起步好几年了,但效果不算好,在方法学和研究思路上还需要不断改进;4)研究病态下的细胞行为和调控。做果蝇的人,也希望能借用果蝇的遗传学方法来研究老年痴呆、癌症等重要疾病的发病机理和相关基因。

这么一看,四块骨头里的后三块都要处理大量的数据、进行比对分析、找出其中的相关性,所以这些遗传学问题自然也就和“复杂”扯上了关系。从简单到复杂,再从复杂到简单,是科学良性发展得圈圈。我在这里想聊一聊“复杂”的基因网络。

按我的理解,基因网络包括三层含义:基因调节蛋白、蛋白之间相互调节、蛋白再调节基因。基因的异常会导致蛋白的异常,蛋白异常的信号会反馈给其他基因,这些基因再转录出更多异常水平的蛋白质。基因和蛋白的反馈也是一直不会停止的。

微观生命世界虽然很复杂,让人眼花缭乱。但总结一下,分子-细胞-发育-遗传的研究搞来搞去也就只有以下几个问题:1)膜的形成和膜上的信号转导;2DNA的复制和基因的转录调节;3)蛋白质的相互作用;4)活体状态下酶的活性及其催化的底物;5)可能还有其他的。这里面中心的问题,应该是蛋白质的相互作用。因为几乎所有的分子水平上的生物学过程都牵涉到了蛋白的碰撞、聚集和解离。

某个重要基因突变以后,会导致与之紧密相连的局部网络的破坏,周边的网络接收到这个信号后,也朝着无序混乱的方向发展,最终导致细胞的死亡和变异;反之,某个重要基因的过量表达,同样也会先影响与之相连的网络,然后迅速扩大负面影响,最终导致细胞走上不归路。

在还没有搞清楚基因和蛋白在分子水平上的作用机理之前(如果这个搞清楚了,微观生物学也就该结束了),基因网络的基础还是来源于实验数据。所以实验数据的可靠性是基因网络研究的基础。当前已经有了很多可以产生大数据量的实验方法。例如:基因测序、检测蛋白质相互作用的方法(Y2H,IP)、研究蛋白调节基因的方法(chip)、基因表达谱(microarray)等等。

基因测序方法已经是很成熟可靠的方法,而且测序的速度越来越快,这让我们知道了越来越多的序列。基因序列是基因网络研究的基础。如果基因网络异常是因为某个或某两三个基因的突变引起的话,通过测序,我们有可能把突变找出来。例如,对癌细胞的基因组测序,可以让我们知道哪些基因的突变会导致癌症。但基因序列所提供的信息对于构建基因网络,还是远远不够的。

蛋白质相互作用的结果,是基因网络研究的关键,因为这写信息能让我们知道基因节点之间的直接联系。目前的方法还不能令人满意,会得到很多假的结果,也会丢掉很多实际存在的信息。在用这些数据的时候,要特别小心。最好把数据的可靠性进行一下划分归类再用。

基因表达谱的研究可以让我们知道编码蛋白的mRNA的浓度变化。mRNA的浓度和蛋白浓度不是一一对应的关系,因为不同蛋白的半衰期是不一样的。基因表达谱的研究发展得很不错,也被大家看好。但它也受到了两个瓶颈的限制:1)以上所说的,mRNA的变化不等于蛋白的变化;2)不同生物样本的基因表达谱的变化常常会出乎意料地复杂,有很多基因都在变化,难以找出哪些变化是关键的。要部分地解决这两个问题,需要在样本处理上下功夫,我们要把样本之间的其他差异控制到最小,而把我们想看的那一部分变化凸显出来。遗传学方法能精确地控制某个基因在特定的时间、特定的细胞里过量表达或者突变。也许两个的结合可以产生一些对基因网络研究很有用的数据。

突然发现写了这么长时间,该结束了。小结一下:基因网络和其他复杂网络的研究都会面临同样的问题,那就是对某些条件和数据的准确性难以把握。对于我来说,我最感兴趣的是如何把噪音调到最小,让基于数据的网络更接近实际的情况。只有好的网络,才能预测出可以供实验学科进一步研究的方向。



https://blog.sciencenet.cn/blog-216720-276443.html

上一篇:女性诺贝尔奖获得者的幸福生活
下一篇:昆虫促前胸腺激素(PTTH),一个讲了三十多年的故事 (上)
收藏 IP: .*| 热度|

14 李万峰 张志东 薛长国 王汉森 王德华 王青云 张亮生 李泳 薛良交 张明 党晓栋 徐涵 yinglu tuanhuichen

发表评论 评论 (8 个评论)

数据加载中...
扫一扫,分享此博文

全部作者的其他最新博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 19:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部