英论阁Enago官方博客分享 http://blog.sciencenet.cn/u/Enago

博文

影响科研工作重现性的五大因素 精选

已有 3554 次阅读 2022-7-28 09:55 |个人分类:学术科研|系统分类:科研笔记

令学术界和工业界倍感困扰的一个问题是科研工作的不可重现性,使得大量已发表的科学发现沦为不可靠的、不可信的或虚假的结果。可重现性、可再现性或可复制性(reproducibility)、可重复性(repeatability)、可验证性(verifiability)讲的都是同一个意思。虽然有些学者去深究这几个词之间的细微区别,例如有人严格区分说重现性是在不同条件下复制,而重复性是在相同条件下复制,但是这种用词之间的区别的现实意义不大。它们说的都是科研成果能够被自己或他人复制重现的程度,具体包括数据或结论的可重复性。对于非概率性数据,如果使用相同的输入条件和工作方法,数据应该能够被重复出来。对于概率性数据,虽然数据无法原样复制,但是结论应该能够被重复出来。本文将为您简述重现性问题出现的原因和规范措施,帮助您提升科研的可靠性和真实性。

众所周知,科研工作的创新性是以科学发现、科研方法、技术产品中的任何一条出现新颖的创意为标志。那么,创新性必须展示稳定的、可以多次反复出现的、可以被验证的(validated)结果,这样才有研究的意义,例如某项生物医学的细胞技术。这并不是说报告在大自然界或宇宙学领域观测到的一过性的、不可重现的新的自然现象就没有意义,这只是说在人类认识世界和改造世界的过程中,绝大多数的有意义的科研工作都不能是偶然的、不可重复的。科研工作的科学性(正确性)和完整性(深广性)亦然,也必须能够被重复验证。

不可重现性问题产生的原因

不可重现性问题产生的原因包括科研方法学术道德两个范畴。在科研方法中,科研工作种类包括理论推导、数值计算、实验测试三大类。科研数据包括确定性数据和概率性数据两大类。在科研工作过程中出现的任何不规范的做法和报告方式,都可能导致自己或他人无法重现科研结果,包括对一个公式的理论推导、对一个设计点的模拟计算、对一套临床样本数据的测试分析等。在学术道德中,数据造假十大学术不端现象之一。数据造假是科研结果不可重现的另一个主要原因,这从不少期刊由于收到举报而撤稿频发就可见一斑。

不可重现性问题为社会带来巨大的学术成果误导或资源浪费。从小处说,它是学术不严谨。从大处讲,它是故意欺诈。例如,很多医药公司根据发表在著名期刊上的癌症研究论文开启了昂贵的药物研发项目,但是却发现仅有10%的发表成果的结论是可以被重现的,导致90%的项目被迫取消,造成巨大的资源浪费。

科研工作重现性的影响因素

影响科研工作重现性的五大因素包括:

·       学术不端中的数据造假;

·       科研工作过程的标准化管理和实施;

·       科研论著中的方法报告和披露;

·       同行评议纠错;

·       同行监督举报和鼓励机制。

一、学术不端中的数据造假

与科研工作中的诚实性错误和疏忽不同,数据造假是具有恶意的故意欺骗行为。造假的动机和行为方式有很多种,包括明知故犯的选择性发表,把并不具备代表性的偶然性数据挑选出来作为必然性数据予以宣称发表,或“报喜不报忧”,以及篡改和编造数据,为了编造创新性来发表论文。

二、科研工作过程的标准化管理和实施

科研工作中重现性问题最大的原因来自工作执行阶段的不规范和发表论文阶段的不规范,导致自己和他人无法重现数据或结论。因此,学术界和工业界越来越强调标准化规范和数据质量控制的重要性,包括实验测试要求具有一定的重复数量或样本例数,使得均数逼真、标准差稳定,并使得样本的统计量能够代表总体的参数,使得统计推断准确可靠等。另外,研究人员不能控制的噪声变量(noise factor)和随机化导致的假阳性等也都可能降低研究结论的重现性。各行各业的科研工作标准化流程方法、统计学规范方法和对复杂数据的分析方法均有所不同。在这方面的标准化研究或推动倡导的贡献无疑是重要和令人关注的,因为重现性问题已经成为一个令学术界和工业界高度担忧而亟待解决的热点问题。另外,工作报告中的数据质量管理也是业界需要大力执行和完善的

三、科研论著中的方法报告和披露

为了鼓励或要求论文的作者在论文的方法部分或附录部分详述数据产生的过程,很多期刊已经放开了字数要求,甚至规定了标准化格式模板清单(包括试剂的供应商名单编码),并要求上传共享数据,以期解决重现性问题。导致他人无法重复已发表工作的原因主要是因为论文中报告的研究方法不够充分和详细,例如对于设备、试剂、软件、输入条件、试验方案、随机化、盲法、样本量估计、数据处理等方面的描述。所谓的随机化是指受试者应当被随机分配到各实验组,并报告随机化方法,以及对数据的收集和处理应当随机化进行。所谓盲法是指在分配方案隐匿时,研究人员应当不知道接下来的受试者将会被分配到哪一组;在进行试验时,研究者应该不知道分配顺序;在研究者评估试验结果时,应当不知道干预的情况。所谓样本量估计,是指应当设计合适的样本量。所谓数据处理,是指应当提前制订停止数据采集的规则和数据的纳入和排除的标准,明确如何定义和处理异常值,规定数据删除的规则,报告试验的操作频率,以及结果是否能在一系列条件下被重复证实等。

另外,也有一部分作者为了保证研究的竞争优势而没有在论文中披露全部的研究细节和数据产生方法,故意不让同行进行验证,从而使得发表的论文的应用价值受限,甚至被指控数据造假。这种情况是不可接受的,因为发表论文与申请专利或商业秘密(trade secret)保护有所不同。

四、同行评议纠错

期刊论文的同行评议是学术界对重现性问题的第一道把关,发生在论文发表之前。目前在同行评议中比较突出的一个问题是审稿人普遍对方法部分论述完整性的审核不够重视,缺乏确保重现性所需具有的学科知识、标准化流程规范意识和审稿要求。这是期刊需要努力鞭策执行的一个短板。

五、同行监督举报和鼓励机制

同行监督举报是学术界对重现性问题的第二道把关,发生在论文发表之后。重现性问题在论文中泛滥成灾的重要原因是学术界不鼓励发表验证别人成果结论的论文,因此很少有学术研究人员会花费时间精力和经费去重复验证别人的工作,除非具有极高显示度的热点课题,这时会有一些科研人员为了开展自己的跟随性研究而先复制一下他人的工作作为科研基础。这种现状造成方法不规范者或数据造假者因缺乏监督而有恃无恐。因此,同行(论文合作者、领域内同行等)之间的监督和举报在期刊和大学的学术制度制订和实施上应当大力开展和鼓励学术期刊也应当考虑设置或扩展专门的栏目(例如快速交流或无时效性的交流信函或论文栏目)甚至专门的验证性期刊或特刊允许和鼓励发表创新性不那么高的专门用于重复验证别人的工作的有意义的论文。这种论文虽然不具有原创型论文的性质,但是在重复验证重大科研成果和监督遏制学术不规范或数据造假上意义重大。科研基金会也应当设置一定规模的资金,鼓励对于重大科研成果的重复验证工作,这样能够从整个社会的层面减少不可重现性对各行各业的伤害。

综上所述,影响科研工作重现性的这五大因素需要全球学术共同体的努力和标准化工作的推动。


*科研工作的重现性离不开准确的语言表达,论文发表中的语言难题就交给英论阁博士硕士学科专家,2000+名母语编辑、平均19.4年经验,为您的SCI发表之路保驾护航!科学网读者专属润色9折

115425h2d2xd8vjtq3sv28.png

英论阁英文润色 术翻译  期刊投稿支持

请关注英论阁微信公众号
EnagoChina

image.png

更多科研出版干货就在
SCI论文学术交流平台
EnagoAcademy


EnagoSubscription.jpg




https://blog.sciencenet.cn/blog-681387-1349059.html

上一篇:科研经费申请的预算制订原则及申请失败的十大原因
下一篇:科研方法面面观:掌握操作、能力、意识三方面 | 英论阁Enago
收藏 IP: 118.247.185.*| 热度|

8 崔锦华 姚伟 杨正瓴 梁洪泽 孙颉 农绍庄 许培扬 强涛

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-9-30 23:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部