刘小乐课题组分享 http://blog.sciencenet.cn/u/CancerBioinfo

博文

计算生物学家是否应该做实验?——Shirley

已有 8460 次阅读 2013-11-1 19:25 |系统分类:观点评述

刚刚结束了中国之行,期间我参加了由施扬教授组织的表观遗传学研讨会和由赵屹组织的青年生物信息学PI见面会。这两个会议都很精彩,并且提出了一个共同的问题:计算生物学家是否应该做实验?我首先要说的是,即使作为一名计算生物学家,我在计算机科学、统计学和机器学习方面也是相对薄弱的。如果我拥有Hasty或者Tibshirani的机器学习能力,抑或是Speed或者Jun Liu的统计学能力,做实验可能就不是必须的。鉴于我有限的定量分析能力,我对此问题的回答是:我们应当做前沿的高通量实验,开发计算方法,帮助推广,在我们自己领域感兴趣的范围内对一些有用的生物学问题进行回答,并且要继续同实验生物学家合作。

我认为基因组学和生物信息学就像是上世纪八十年代的分子生物学。它们是非常有用的,但是也仅仅是回答特定生物学问题的工具而已。在这一次的表观遗传学研讨会上,可以很明显地发现,许多做实验研究的实验室在基因组学和生物信息学方面变得越来越在行。实验生物学家们已经克服了学习基因组学的瓶颈,这将迫使计算生物学家更加独立。我们必须拥有自己的生物学领域和生物学问题。完全依赖于挖掘公共数据来回答一个特定的生物学问题有时候是不可能的,所以必须做一些实验来产生数据。当然,对于生物学上非常关注问题,如果一些简单的实验就足以回答一个重大的生物学问题,那就可以自己去做。如果我们可以付费给公司或者中心实验室来帮我们做实验,那就更好了。这里实验所研究的问题要起源于大数据挖掘,并且检索文献以确定这个假说尚未被发表。如果这是一个重要的生物学问题,任何实验生物学家都能容易得想到,并且需要完成的实验也简单,请放心这些肯定已经被实验生物学家尝试过了。如果假说是新的,并且来自于对公共数据的挖掘和建模,但是实验验证比较复杂,我会建议与一个实验小组合作来进行实验验证。我们自己进行实验验证的问题在于,根据假说进行实验验证可能会是这种情况——今天做细胞生物学实验,明天做生化实验,后天做成像实验,再接下来一周又要做动物模型实验。我们根本没有精力将它们全都学会。这与实验生物学家们之间的合作没什么不同,但是跟实验生物学家进行合作并不意味着我们没有自己的生物学问题。只要生物学问题确实是好的,并且我们假说的证据足够牢固,那么肯定会有感兴趣的实验小组愿意帮助我们的,尤其是如果我们之前在信息学方面帮助过他们。

有一类实验计算生物学家应该重点去做,就是那些不仅能产生数据供我们分析和验证,并且还有有趣的数据供我们开发算法的实验。我愿意引用我的一位同事兼合作者Mitch Lazar的话,计算生物学家应当走在技术的前沿。作为计算生物学家,我们很可能在基因组学方面水平还不够开发新技术(如果你可以,那就太好了),并且新技术的发明是有风险的,既耗时又耗钱。而尽早地采用新技术可能是一个更好的选择。我们可以采用这些技术来回答有趣的生物学问题,开发计算方法帮助其他生物学家接受这些新技术(比如针对ChIP-seqMACS),辨别出技术开发者在分析他们数据时存在的潜在偏见(请继续关注我们正在修订的关于DNase-seq分析的Nature Method的论文),发现这些技术的原始开发者未曾想过的新用法(比如使用组蛋白标记的ChIP-seq来预测核小体位移和转录因子结合)。

除了具有前沿性之外,我们做的实验还应该具备如下特点:

一、产生高通量数据,这样我们就能运用生物信息学的专业知识去分析它。例如,尽管CRISPR/CAS9是前沿性研究技术,但它自身可能并不足够高通量,所以我们需要结合另一个前沿性高通量实验,使之为我们所用。

二、是否确实像技术开发者在论文图表中声称的那样好。任何人都可以通过高通量数据选一些实例来表现其运作的很好。但是关键是要将数据下载下来,看数据噪声如何,结论能否站得住脚,是否真正回答了以前的实验方法无法回答的问题?有时候一个数据集是不够的,可能会导致方法过度拟合,所以我们需要至少3个好的数据集来开发工作算法。

三、回答我们感兴趣的生物学问题。举个例子,如果我对转录调控感兴趣,那么对我来说ribo-seq可能就不合适,因为它研究的是翻译效率而非转录调控。

四、实验不能太困难、太昂贵。首先,我们自己才能在一定时间和预算内把它学会做好。同时,为了让算法运行得出色,今后必须有足够的公共数据来帮助改进算法,并且在算法评估上要依靠群众的智慧,越多的实验室能生成这种数据来使用评估, 好算法才能真正显出来。例如对于PPI来说,有3个工作组产生高通量数据,1000个生物信息学小组开发算法,最后不管别的算法如何出色,胜出的总是产生数据的小组。

像我这样的计算生物学PI,通常不善于亲自尝试这些实验。我们根本没有时间或者一双巧手来完成实验,当然我当年作为一名年轻的 PI 的时候犯过这个傻更好的方式可能是,我们可以雇一名有能力的实验博士后来做实验,就像实验PI招募有能力的生物信息学博士后一样。更好的情况是,与实验合作者共同指导实验博士后。这将有助于招募一名更好的实验博士后,并且两个实验室一起提出更好的实验设计和生物学问题。此外,实验博士后在尝试这些新的技术时也会更加有动力,而不是看起来仅仅是计算生物学实验室的一名实验技术员而已。实验组能够帮助排除实验困难,计算生物学组则可以分享在分析和算法开发方面的信息学知识。一旦掌握了技术,我们可以用它回答其他系统中有趣的生物学问题,在实验(教别人如何做实验)和计算(在人们分析新数据时为他们开发算法)两方面同时促进学术圈内其他人员采用这些技术。我真的很钦佩Myles BrownJason Carroll以及基因组学研究团体中的很多先驱者,在他们的慷慨帮助下学到了新的基因组学技术。这个领域发展得如此之快,保守技术的秘密只会导致他们自己的技术被更新的技术所超越。同时,我也相信Benjamin Franklin的观点行善得福(要想自己成功,就要为别人做好事)

除了以上理由,在中国做实验也是一种保障实验室运行的必要。基金资助机构将薪资限定在总资助金额的15%以内。对于一项100万人民币的资助,如果计算生物学家仅仅花掉了15万的薪资费用和15万的设备及耗材费用,那么下一轮资助中基金资助机构也许只会给你30万人民币,同时你只能将4.5万用于薪资,由此陷入恶性循环。计算生物学实验室如果不做实验的话,过不了几年将会被迫关闭。

最后感谢王春超同学翻译成英文付出的努力,也希望其他读者能够喜欢我的博文。


 



https://blog.sciencenet.cn/blog-1002805-738109.html

上一篇:升级要慎重,备份要勤快 -- 杜舟
下一篇:王苏关于BETA算法文章在线发表在Nature Protocol
收藏 IP: 124.77.247.*| 热度|

7 薛宇 张治华 马兆武 翁志萍 张成岗 黄捷 warren222

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-23 01:44

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部