|||
合格的科学研究应该是可以重复的。跟其他学科的朋友聊天,也听说过重复前人研究工作,而后再开展自己的工作。而在生物学上,我们很少听说有谁这样做。重复的人少,生物类论文的作者和期刊对论文的可重复性也就不太重视。在方法的描述上,经常忽略很多细节。
最近一期的Nature Structural & Molecular Biology代表Nature集团发表了一篇社论,Raising standards:Nature journals' updated editorial policies aim to improve transparency and reproducibility (1)。Nature系列研究期刊要通过一些改革提高科研成果的透明度和可重复性。
其中首先是强调增加Methods一栏在论文中的比重,要求作者将研究过程、方法手段描述更详细一些。其中的关键是增加了一个Checklist促使作者公开更多的技术和统计细节。
为了增加透明度和可重复性,他们的另一重要举措是鼓励作者提供图片背后的数据。作者研究获得一组数据,往往倾向于用散点图、柱状图等图形将研究结果直观的显示出来(2)。但数据图形化无疑后,读者就只能接受结论,而无法对数据进行再分析了。现在要求作者发表图形的同时,提供图形制作该图形所用的数据。这一举措,虽然他们的目的是提高透明度和论文的可重复性,但对读者来说,这无疑是增加了很多有价值的“原材料”。读者可以在这些原材料的基础上从别的角度进一步分析研究,发现原作者没有发现的现象或规律。
生物学上,十几年前,绝大多数人都很喜欢强调自己发表的是原始数据。到了基因组时代,很多人在他人原始组学数据的基础上做再分析、再研究。原因很简单,发表原始数据的人不可能(没精力、没能力或者没兴趣)把原始数据背后所蕴藏的规律和现象全部挖掘出来。生物信息学和基因组学等各种组学的蓬勃发展,人们对前人数据的再利用的已成为家常便饭。一项科研工作完全没有原始数据也没什么丢人的。
对论文图形背后的数据的公开、利用,将再一次推动科研工作的革新。论文图形背后的数据,往往是对原始数据进行分析、提炼或总结之后的,非常便于读者再使用、再分析。生物信息学和计算生物学是利用他人的原始数据,对研究人员的数据处理能力有一定的要求。没有一定的程序设计功底,那么多基因组转录组数据,放在那里你也用不了。现在,如果把图形背后已经提炼总结之后的数据公开,只要你有想法,你会敲键盘鼠标,你就可能对他人的研究结果进行再研究、再分析,发现前人没有发现的现象或规律。
公开图形背后的数据,在我看来,其意义远大于增加原研究论文的透明度和可重复性,所以我的标题是“Nature系列期刊促进信息传播交流的新举措”,而不是没有直译“improve transparency and reproducibility”。顺便对Nature系列期刊及所有学术期刊提个建议,"we now also encourage authors to provide, in tabular form, the data underlying the graphical representations used in figures"。为了促进科学的发展,这个encourage应该改为require。
(1)、如果对此文感兴趣,却又无法访问该文全文,我可以帮忙下载一下该文,我的邮箱在我的主页上:http://cmb.bnu.edu.cn/teachers/niudk.htm。
(2)、图形明显比表格清晰易懂。所以专业论文写作的一些指南中常提醒作者,能用图形就不用表格,能用表格就不用文字。文字表述的效果最差。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-28 15:30
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社