英论阁Enago官方博客分享 http://blog.sciencenet.cn/u/Enago

博文

当今数据密集型研究如何改变着科学家们的技能 精选

已有 2721 次阅读 2016-12-20 08:54 |个人分类:科技之窗|系统分类:观点评述|关键词:数据密集型研究,科学家的技能,计算机技能,数据处理,数据科学家,数据科学家职业前景


计算机时代的黎明早已过去,当今的科学家也不再是人们心中那种穿着白色实验大褂在一堆仪器前不眠不休做实验的形象了,也许他们还是在秉承着奉献精神把大部分睡眠时间给了科学,但是科学家们转移到在计算机上的时间也越来越多了。不管是哪一个研究领域的科学家,他们都具备的一个传统科学研究技能,就是先观察思考,提出假设,然后做实验收集数据。在过去,实验数据都是在低输入量的实验机制中得到的;然而如今的科学家们有能力去实施高输出量的实验了,所以不可避免地,他们也要学会对本质上就是数据密集型的研究进行合适的处理。

--- 更多精彩文章请造访【英论阁学术院】---

以生物学家们为例,15年前的基因测序大多是费力且昂贵的。因而在理想状态下,研究者们会只专注他们感兴趣的物种里那些他们感兴趣的基因。在生物学迅速发展的几年之后,基因测序的花费也大幅降低,这也给生物公司以及财团提供了机会来发表基因组测序结果,并且这些数据看起来似乎在以惊人的速度增长,以至于可以公开获得的物种数以千计[1]

生物学家们也想知道以前的假设是否符合更多的物种子集,但是由于他们并未经过专门训练去解决这样大量的数据,光是手动检查数据就已经很费时费力了。但是也不能让程序员来处理,因为他们缺乏可以发现生物学显著结果的背景知识。于是科学家们就需要一个能够自动进行的工作流程:一个高效能的计算机来储存和处理这些基因组。除却输入数据这一难题,发表数据也是一个挑战:如果光是呈现所有的原始测序数据,那么一篇发表论文就会变得异常地冗长。到这一步,生物学家们很有可能就会迷失——他们既不能靠传统的技能来实现对大数据库的计算,也不知道怎么将数据转换成一个可以发表的格式。

不止生物学,如今所有的科学学科都在面临着需要处理庞大数据库的挑战。所以,当今的科学实践就要求了科学家们能够完全熟悉广范围的计算工具和算法。这样一来,当科学家们设计实验时,这些新技能和工具就能快速上手并能让他们实现在其研究领域里前所未有的影响。当然,成为一个科学家所需要的基本条件没有变,我们仍然需要条理化、有逻辑的并且有着完善实验方法的研究人员,但是有数据密集型的计算经验成为了先决条件。所以未来是属于“全能型选手”的:既能快速地将实验数据转换成实验结果,也可以有效地将他们的实验结果呈现给广大科学听众。


如今许多科学家们开始将数据科学修为他们的第二专业,并且有很多其他研究领域的博士生、科学家将兴趣转移到了数据分析成为了数据科学家。在学校里,许多博士和硕士项目也给学生们提供专门的数据科学的训练。


如果你也是一名准备从事数据科学的科学家,那么你应该知道这项专业技能是很有前景的:各行各业都需要有着特殊技能的科学家,比如医药公司就需要有人将临床实验结果转化为决策人能够利用的信息。如果你是一名准备从事数据科学的科学家,那么你也需要问自己:你真的对数据处理分析很在行吗?你的竞争者很有可能也发表了和你一样多的学术文章,他们也可能报了跟你一样的基础训练班。在你具备的所有技能中,好的计算机技能能让你在人群中脱颖而出。


如果你对实验室管理很感兴趣,那么数据管理工具比如SQL,R Tool, SPSS 或者SAS都是很好的工具来帮助你练习处理密集数据并转换成有意义的结果。其他一些软件比如LabguruQuartzy可以帮助你与实验室成员或合作者分享数据。如果你对数据可视化很感兴趣(一种流行的新数据领域,可以将原始数据转化成激发思考的图形),那么生命统计学或者新闻媒体就需要可以做到数据可视化的人才。Plotly提供的Python库全是关于可视化的知识,是一个练习的好起点[2]


当然,当一个数据科学家求职时,处理科学数据的技术能力可以在简历中就被筛选,面试官最注重的第二点就是科学家们能够独立思考和思维自由的能力。对于博士生们,最重要的也就是能够自我创新和引导自己的项目,并且能够跳出思维条框想出一个新的解决办法而不是依赖于现有的方法[3]。这样的科研素质要求对于数据科学家也不例外。

§博客内容皆由英论阁资深学术专家团队撰写提供§

--- 英論閣SCI論文潤色服務及多項免費附加項目,點擊了解---

References

1.http://blogs.nature.com/naturejobs/2016/09/30/how-is-the-rise-of-data-intensive-research-changing-what-it-means-to-be-a-scientist/

2. https://www.aspet.org/Computer_Skills_for_Scientists/

3.http://blogs.nature.com/naturejobs/2016/09/07/finding-job-satisfaction-as-a-data-scientist/





http://blog.sciencenet.cn/blog-681387-1021824.html

上一篇:研究人员不可不知的伦理委员会
下一篇:开放式获取学术出版意味着免费的知识普及吗?谈前景和挑战

1 王志强

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|科学网 ( 京ICP备14006957 )

GMT+8, 2017-5-1 08:25

Powered by ScienceNet.cn

Copyright © 2007-2017 中国科学报社