|||
交叉学科盛行时代生物信息人的职业发展规划
拜读了Lab 严大师手笔的文章,也手痒想一吐心中对自身所在领域的看法
【bio】交叉学科盛行时代生命科学研究者的立足点本人在武大bachelor学计算机软件工程,Master 和Ph.D改bioinformatics, 一直希望是成为computional bio。在这个块前后摸爬滚打了3年左右,发现自己虽然在技术方面也算是略有积累了,但在文章这方面做得再努力, 能有篇不依赖pure实验的 BMC、bioinformatics、Genome bio这类期刊上下也就是功德圆满的(至少龙星计划中某位大牛Prof.Liu XL Shirley 是这样启发我的)。
这个时候技术做得再多,也就是个量的问题,职业发展方面很难有质的突破。对于一个20中旬以搞科研为本职的人来说,还有什么比思绪枯竭,没有生长点,发展潜力达到瓶颈更为可怕呢?
现在到一个纯生物学的实验室,生物技能锻炼方面虽然还不好说,但至少思维开阔了不少。
我承认有人能靠几项独门的、计算方面的技术吃饭,但大多数人做不到那样。
因为行业里的人越来越多,你会的大家都会。而且高通量技术在不断发展,技术更新太快。6年前,也就是04-05年那个时候。做bioinformatics的会分析几种microarray data那就算是高手了,而现在如果还只是做这个, 求做technican都不一定够格。
现在发展的关键,我个人认为是怎么样把计算方面技术找生物学切入点,融合进去,最终在这个点上占上一角。
当然我也不否认有一些大牛,完全靠计算也能做得很棒,如David Haussler.
现在真正做bioinformatics做得好的人中,十个有九个是在考虑计算和生物学的共同点。如Christopher Burge, Job Dekker 他们整天在思考如何把两个领域融合起来,而不是在争论它们的分歧。
在这行里也混了几年了,这点发展的大趋势还是能看出来的。
1. 编程,文本处理
这个是入门的基础,我认为这个最倒是好办。
在有人带的情况下,如果自己对电脑比较感兴趣,那么linux+Perl有2~3个月就入门了。
之后再学其他语言要看课题需求、编程习惯和对学科的理解。比如JAVA,C++等。
这样做各种比对、文本处理应该没问题。
再熟悉了各大生物学主流数据库,那么就可以先摸爬滚打了。
只是进阶比较难。一方面靠积累,另一方面看悟性了。
2. 统计学、数学方面,
我还是主张先学统计,再结合这学语言。
我当年是概率统计,线性代数基础都比较好,之后再结合学的R,这样之后做起来的时候完全是在先解决统计学语言的技术问题,不纠结统计学本身的问题。
这样一年下来,R学了个大概,画图凑合发文章够用了。
但还是那句话,进阶难,去想深讨统计学本身太漫长。
3. 数据库,webserver
这个相对来说还是性价比比较高的。学起来快,出东西也快,不太费脑子,运气等其他不可预知因素小。
缺点就是做生物的不能只靠这个吃饭,这不是做生物信息的核心竞争力。(当然如果你们实验室有能力能搞出并维持那些大型综合性数据库,算我没说)
这方面可以搞点东西凑合毕业,但也别做得过多。不然就成了码农,失去作为生物信息自己的核心竞争力了。
4. Hihgthough-put sequencing, Omics
包括基因组学、转录组学等等分支。需要做各类高通量分析,序列分析,功能注释,按各种条件分类等等。
另外要时刻关注当今一些新技术,让课题的瓶颈在数据解释方面,而不是在你的分析和速度方面。
5. 生物学着力点
对于做bioinformatics的,我认为最难,最有前途的,就是从几个G的data里面,整理出来个各方面面都说得过去的、又容易验证的story来。
完全考验人的思维和科研背景,靠积累。
以上几点,在有人带的情况下,2~3年就能入门,再来1~2年凑合着做点东西运气不差应该够毕业了。头脑灵活又运气好的,可能4年之内就能弄出点东西出来。
和打游戏练级一样——进阶比较难,看个人了。
这个行业虽然交叉,繁杂,但也不是那么难入门,不需要耗那么长时间。
我个人建议先从某些简单的分析入手,之后再学别的。
少林72绝技,你只要会那么一两手大家都欢迎的主流技术,够你闯江湖的就够了。
关键是需要一个比较成型的实验室,或者有熟手带你。如果自己摸索就会很迷茫。至于经验、视野、科研思维这类真正重要,靠却积累的事情,毕业之后慢慢来吧。总会找到一个合适的平台继续成长。
这里生物信息泛指生物信息学+计算生物学,本文仅是职业技能上的浅谈,希望能够抛砖引玉~~
我觉得职业发展应该是广、深必备。
广:熟练各种编程语言,能够处理各种数据,同时学习相关生物知识;
深:在某一生物研究方向深入,熟悉从实验到数据及结论的各项环节。
广而不深的后果是没有确定的研究方向,总是给别人实验作工具,做嫁衣;
深而不广的后果是在当今数据爆炸的时代发展机会少。
难点有以下几点,难度依次增加:
1. 各种类型编程语言的熟练使用:并不是指掌握所有语言,而是根据数据对象选择那
么几种有代表性的语言。理论上C/C++可做任何事情,但会用R/Matlab/Perl等会在一些场合更高效一些。
2. 学习各种生物知识:一方面是书本知识,其主要功夫是在业余时间的利用上;另一方面是实践知识,来自于生物实验室,交流为主。
3. 同时还得学习相关数学知识:这绝对是个难点,会编程不等于懂数学。
4. 某一个方面深入。这里说的方向必须是生物Biology研究的方向,而不是生物信息的方向。
我觉得以上几点都达到的话,从读博士起大概需要3-5年时间。
生物信息全才=生物+统计+建模+数据库+软件。
全观上述,给出生科人职业发展的金字塔模型,为晋级而努力中...
Jie Huang
12-26-11
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-21 20:09
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社