|
大家在实际科研中经常碰到一个问题,就是在实验中根据转录组数据后可以求出一个共表达网络,知道哪些基因一起表达但不知道基因之间实际是怎样相互作用的。共表达其实是基于基因之间的相关系数,而相关系数跟实际的作用机制大概是一个包含的关系。即有调控关系相关系数比较大,相关系数比较大不一定有调控关系。举两个最简单的例子,如果A基因同时调控了B和C (single input),那么B和C之间的相关系数也是比较大的;又比如A调控B,B调控C (cascade),A和C之间也有相关性。这两种拓扑结构按相关系数去构建的话都是全连通的图。
那么有没有可能根据某些模型在相关系数(甚至其它指标)的基础上得到更接近调控网络的结构呢,答案是肯定的,现在已经有这样的技术能够挖掘出直接的调控关系,删掉非直接的调控路径。我们这里介绍一篇Nature Biotech的工作就是处理了这类问题。他们采用的方法叫做网络反卷积(Network Deconvolution)。就整个问题的框架,可以参考下图
我们发现对于左侧的实际网络,实际观测得到的往往是右边这种包含很多非直接相互作用关系的连接比较稠密的网络。那么网络反卷积就是通过对右侧的观测网络进行某种操作,得到左侧的直接相互作用网络。这种操作的数学原理是这样的(其实并不高深),就是将观测得到的相互作用展开为直接相互作用和间接相互作用的线性加和,即
Gij反映的是j对i的总相互作用,Sij反映的是j对i的直接相互作用。把公式右侧的G一直用这个公式迭代,就建立了直接作用网络和观测网络之间的关系,而具体的计算就是线性代数的问题了。作者通过计算可以发现即使直接相互作用和间接相互作用不满足上述的线性叠加关系,也可以去除网络中大部分的非直接作用关系。如下图所示
作者证明了甚至对于已有的网络发掘的算法,再利用网络反卷积算法精度都会有所提高,这是一个有趣的结果。还有一些有趣的应用,包括利用该算法预测蛋白质结构,预测科研合作网络的强度等等,也揭示了逆向工程技术应用的广度。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 23:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社