simonstone的个人博客分享 http://blog.sciencenet.cn/u/simonstone

博文

为什么生命科学领域质疑与“造假”频发? 精选

已有 13297 次阅读 2016-9-4 11:49 |系统分类:科普集锦| 生命科学, 造假, 生物

近来,生命科学圈内又被新的一轮质疑与“造假”疑云笼罩,这次的主角是前不久轰动一时的 NgAgo 基因编辑技术。四个月前,主流媒体还将其视为 CRISPR/Cas9 的一个颇具竞争力的挑战者,如今其重复性经过超过一百个实验室检验后仍显得不够稳定可靠。更有质疑者已经进一步开始怀疑其作者提供的数据是否可靠,并翻出作者的其它文章寻找作伪的可能证据。这不禁令人想到生命科学领域刚刚过去不久的一些丑闻,例如小保方晴子的 STAP。为什么生命科学领域内的质疑与“造假”看起来如此频发呢?

统计数据表明,生命科学领域的文章撤稿量显著高于其它学科。根据 M Zhang 等人 2012 年对从 1980 年到 2011 年 Web of Science 上各学科发表文章及撤稿情况的统计(Scientometrics,2012,96,573-587),属于生命科学领域的生物化学和分子生物学贡献了最多的撤稿量,并且其撤稿率(文中用“每十万篇文章的撤稿数”来衡量)也与同属生命科学的药物化学一道高居前列。唯一比其撤稿率高的是晶体学领域,而这主要是因为有中国井冈山大学的钟华和刘涛一次性造假 70 篇、Acta Crys. E 撤稿的“贡献”。

他们还对撤稿数多于 15 篇的杂志进行了统计(PLoS ONE,2012,7(10),e44118),共计 22 份杂志,除去综合性杂志 Nature、Science、PNAS 和四份其它领域杂志(物理的 Appl. Phys. Lett.,化学的 JACS,晶体的 Acta Crys. E 以及材料的 J. Hazard Mater.)之外,其它 15 份都是生命科学相关期刊。被撤稿数最多的 15 个作者(他们占了总撤稿数的 52%!)中有 10 个从事生命科学或医学研究。这些数据表明,生命科学领域的质疑与“造假”频发,并非是错觉,而是事实。

撤稿的主要原因是什么?F C Fang 等人对 PubMed 上 2047 篇被撤稿文章进行了统计(PNAS,2012,109,17028),发现 43.4% 的撤稿是由于作伪欺诈或涉嫌欺诈,14.2% 是由于重复,9.8% 是由于抄袭,21.3% 是由于错误和误差,其它占 11.3%。也就是说,六成以上的撤稿都是人为因素造成的,而其中作伪欺诈又是主要的学术不端形式。这说明,主观的学术不端行为构成生命科学领域质疑和“造假”频发的主要来源。

一般认为,学术不端行为有多种诱因(PLoS ONE,2015,10(6),e0127556)。例如科学研究政策和导向使得急功近利思想产生、不同社会文化对造假和抄袭宽容度不同(例如欧美以造假为主,东方以抄袭为主)、同行评议阶段的不公平现象、科学工作者的职业生涯需求等,甚至性别都可能是影响因素,例如有研究认为生命科学领域内男性比女性更容易造假(mBio,2013,4(1),e00640-12)。以上多是针对一般学术不端进行的讨论,还不足以充分解释为何是生命科学领域、而不是其它学科,存在着如此显著的造假情况。

生命科学领域的根本问题是缺少系统可靠的理论体系、从而缺少明确有效的证伪方法。在纯数学和理论物理领域,伪造数据和过程几乎是不可能的,其原因是每一步都可根据严密逻辑保证其可证伪性。实验物理和化学则相对更宽松些,对实验偶然性的依赖也更大些,但目前理论的进步和分析手段的提高也使得人们能够较为明确地判断真伪。而在生命科学领域,由于生命系统的复杂性和众多未知因素的影响,不同的通路和逻辑都有可能成立,因此在其学术研究上往往是发现比发明更重要、更显著。反过来,如果某种发明是以他提出的发现为基础的,那么一般很难直接质疑这种发明的可靠性。

例如,耐高温 DNA 聚合酶是 PCR 技术的基础,但人们长期没有开发出这样的酶,直到在黄石公园的火山口中发现了耐高温生物嗜热菌(Thermus aquaticus)才得到了 Taq DNA 聚合酶。这里,PCR 技术就是依赖于发现的发明。再以基因编辑为例,CRISPR/Cas9 建立的方法只是提供了基因编辑的一种进路,却不能排它。如果有人声称发现了具有类似作用、但不是这一系统的某种或某几种神奇酶,评审者很难判断它们是否真实存在,一般只能接受作者的陈述。

一旦进入这样的思维范式中,作为评判者的审稿人就只能诉诸两点来判断:一是自身逻辑链条的完整性,二是实验数据的真实性与可靠性。如果文章能够自圆其说,又没有发现明显的实验数据编造情形,那么多数情况下都应当认定为真。接下来的问题是所谓的“自身逻辑链条”能否完整。生物学家赖以为据的众多凝胶电泳实验手段实际上都提供的是间接证据,因为它们并不能反映蛋白或其它大分子的真实结构和组成,只是通过一系列间接比较得出的信息。直接的逻辑链条现在还只能来自于结构生物学、生物物理学等十分“Solid”的科学门类。更重要的是,生命科学目前的数理逻辑水平并不高,一般都没有办法给出特定体系的排他性逻辑进路,常常将相关性、因果性和时间先后出现的顺序混为一谈,对回归分析、数值分析等的正确运用场合不甚了了,这些都使得所谓的“自身逻辑链条”可能本身就存在先天不足,因此评审人的意见也要受到很大程度的约束。这是大量生命科学研究的次品甚至赝品也能够在学术期刊上占据一席之地的内在原因。

从外部考虑,生命科学研究的对象与普通大众、与每一个人都息息相关,因此生命科学研究的进展最容易吸引大众的眼光与市场,突破性的进展往往给发现者带来社会地位和社会价值的极大提升,以至于已经达到了可以诱人铤而走险的地步。而生物学术圈内竞争的激烈程度又加剧了这种两极分化,从而进一步激发个别人的不良欲望,这与前面分析的学术不端可能来自于职业政策要求和急功近利思想是一致的。

自然,在生命科学研究中也存在着话语权竞争和市场化运作的成分。例如现有生物技术的既得利益者往往会通过质疑和挑战打击新生生物技术,以维持自身地位。而新生技术也可以反过来质疑旧技术、从而达到扩大市场的目的。这些利益关系与一些特定问题的联系可能尤其紧密。不少人呼吁让科学评判只由科学家来做,在涉及到现实利益划分的时候就显得过于天真了。基因编辑如今已经是走向商业化的生物技术,涉及到它的争论,尤其是非学术期刊、同行评阅发表的言论,都值得以这种视角来进行重新观察。

以上分析当然只是一个简单的观察,但生命科学研究中的这一现象是不可否认的。号召大家提高道德修养,或者依靠改革管理体制和期刊发表体系,虽然也是必要的,但要想依靠这些解决这个问题,未免是扬汤止沸。解决这一问题的根本之道,应当是通过将生命科学目前的研究逻辑化、规范化,建立可靠、系统、全面的可证伪思维方式,这样才能从源头上减少生命科学“赝品”研究出现的可能。

注:原文 2016 年 8 月 2 日发表于“听石先生的文字”微信公众号上,此处略有修改。




https://blog.sciencenet.cn/blog-711486-1000771.html

上一篇:对拙文《科学界如何面对批评》的一点说明
下一篇:新书《物理有机化学:结构与原理》正式出版上架
收藏 IP: 166.111.28.*| 热度|

13 王又法 吕健 王毅翔 黄永义 彭真明 陈南晖 王立新 吴炬 汪晓军 ghzhou5676 biofans lindajia loyalSciencefan

该博文允许注册用户评论 请点击登录 评论 (18 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 20:32

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部