|||
标题有点哗众取宠。最近The New York Times 聘请哥伦比亚大学的生物学研究人员(Chris Wiggins)作为其“首席数据科学家 (chief data scientist)”. 具体报道见: WHY THE NEW YORK TIMES HIRED A BIOLOGY RESEARCHER AS ITS CHIEF DATA SCIENTIST
Chris要做的事情说起来很容易,就是要“预测哪些用户将退订The New York Times (Unsubscribing? The New York Times Wants to Predict That.)”, 但是做起来可不容易。看看Chris的个人简历就明白了,不仅要有很强的统计学背景,还需要很深厚的机器学习(machine learning,ML)的功底。 统计学已经是一门妇孺皆知的学科,机器学习对一部分研究人员来说可能会有些陌生。
ML是人工智能这个领域的一个分支,在多个领域已经有了广泛地应用。掌握这门技术,您将会像Chris一样开启一条新的职业发展道路。这里还有更多让人振奋的消息:
Google this year spent $400 million to acquire a single machine-learning startup (see "Is Google Conrnering the Market on Deep Learning?"
Amazon is currently advertising positions for 40 machine-learning scientistis-in addtion to scores it already employs.
除此之外,诸多国际知名公司(像Microsoft, IBM)都对ML很是重视, see Microsoft research- machine learning department. 在如今的大数据时代,ML更是变得不可或缺。
当然,如果您不想像进军其他行业,在生物学领域也可以大有作为。 ML已经成为生物信息学和系统生物学研究的一门核心技术,基于ML已经开展了诸多理论和应用方面的研究。大家熟知的Human ENCODE project, ML已在其中大展身手(Machine learning approaches to genomics: ENCODE has applied machine learning approaches to enable integration and exploration of large and diverse data)。用"machine learning"关键词搜索Pubmed,您将获得5000多篇ML相关的研究文章。如果感兴趣,先看看其中的review吧。
最后,夹点私货,我们最近用ML技术开展了拟南芥胁迫应答基因的挖掘研究。对6种非生物胁迫的分析结果表明,ML较传统的差异表达分析方法能够更准确地预测出胁迫应答基因, 还可以预测出一批表达水平变化不大的胁迫应答候选基因。有兴趣的可以进一步挖掘一下这些预测结果。具体内容见:Machine Learning–Based Differential Network Analysis: A Study of Stress-Responsive Transcriptomes in Arabidopsis
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-16 01:12
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社