最近,《浙江大学学报》的张月红老师在Nature上发表的一个关于该学报稿件中有31%被Crosscheck出抄袭的文章成为科学网上的一大热点话题,诸博主为此议论,连日来的头版头条基本都是关于此事的。如此惹火动人的话题,自然有有各方人士的各种观点不断闪亮登场或者黯然谢幕,显得热闹非凡。鄙人没有精力去逐字逐句地仔细研读有关的消息,也不想做出自认为公正的判断,所以这几天只是带着学习的态度在冷眼旁观,没有专门为此写东西。刚才看了科学网的新星曾庆平老师的新作“抄袭几段话犯什么罪了!”【1】忽然觉得其实抄袭这个问题并不是大家讨论的那么简单,也许我们需要跳出对是否“抄袭”、有多少“抄袭”这种“就事论事”的争论从更高更远的视角来审视和思考相关的问题,所以就有了这个题目——“学术论文真正的价值在哪里?”
发表在学术期刊上的学术论文,毫无疑问是给业界同行们看的,里面包含的内容应该包含比较丰富的新信息,包括新思想、新观点、新方法、新理论、新结果、新解释等,具有供学者们和学生们互相学习、切磋、借鉴和参考的作用,这应该是学术界同行们大抵都能够达成的一个基本共识。所以,学者和学生们翻看杂志、查找文献时,应该首选对他们自己的研究有启发和借鉴作用的文章,仔细地阅读文章时也是在重点看有这样作用的部分和段落,甚至看了一篇文章后会认为最值得记忆的就是其中的一段话或者一个图表(当然这篇文章的作者、发表杂志的名称及卷期页码也须记录,以便引用),文章的其他部分,或许会被和众多类似相关文献一起“合并同类项”甚至很快就被淡忘。因此,新的、与众不同的东西,才最能体现一篇学术论文的真正价值和水平,而那些趋同的或者高度相似东西,虽然不能缺少,但价值相当有限。
然而非常不幸,现如今大家的关注焦点不在这些最有价值的部分,而在与没有价值的部分,因为最有价值的部分除非作者自己标注,否则不会被Highlight出来,而没有多少价值的部分,却很可能会被Crosscheck之类的软件给Highlight出来,一Highlight了就会吸引眼球,就会很快成为热议的焦点。那么为啥这些本来没啥价值的地方反而会给Crosscheck成Highlight呢?原因在于那些部分的语言描述,很可能由于或抄或仿这类主观的原因,甚至由于“英雄所见略同”大家用了相同的词语句式去表述的客观原因被认为疑似甚至认定为“抄袭”。如果一篇论文有几段被认定为“抄袭”从此背上这顶“黑锅”,不管这几段出现在什么部分、在何种情况下出现,都是好说不好听的,绝对不是件多光彩的事情,甚至让文章中最闪光的那部分思想也蒙上又黑又厚的“锅底灰”,让本该因为有所创新而容光焕发的作者也变得“灰头土脸”。这种现象,用两句咱中国的老话形容此事,那就是论文主要部分的创新内容“做糖不甜”可能“成事不足”,论文次要部分(也不得不写)的重复叙述“做醋保酸”结果却一定“败事有余”。此时学术论文体现出一种新的“价值”——检验一个人的学术诚信。
造成这种价值倒挂的吊诡现象的原因其实也很简单——版权!因为作者和出版商要求必须尊重其版权,那么以往的学术论文作者写出的每一句话,列出的每一个图表都要被后来者尊重,在后续相关文章中都应该被合理、恰当地引用而不能草率滥用。这种要求显然是合法的,但却未必足够合理。正常情况下,科学论文的实验数据是新的,图表也是新的,甚至对实验现象分析解释的观点和论述方法都是全新的,但有可能在引言部分和实验描述部分出现一些和已有文献相同的表述,这就会被软件认定为抄袭,如果后续跟进了人工判断并督促整改还好,如果就此认定为抄袭,作者可能就比窦娥还冤了。其实有时作者很无奈,一个领域的研究背景情况和进展介绍、实验描述,在不同人的笔下也不会有太多种表达形式,前面人用过了的后来者要是不想重复就得搜肠刮肚去找新的描述,难度很大,如果不幸这个领域很热门,一年有N多篇文章发表,后来者必然为此痛苦异常。长此下去,如果学者们造不出新的表述语句,或许只能用很简短的几句话表明自己最新的观点和看法,结果让学术论文变得像现如今流行“围脖”(微博)一样微薄了。
如此困局,出路在何处?希望博友和读者们在思考之后给出良策。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
参考:
【1】 曾庆平:抄袭几段话犯什么罪了!
本文已在《科技导报》发表。