|||
说不清从什么时候开始,科研诚信成为人们关注的一个热点话题。CNKI专门有一个CNKI科研诚信管理系统研究中心,登录http://check.cnki.net/,可以看到中学生作文、大学生论文、学术不端文献检测系统等一系列产品。万方也推出了论文相似性检索系统beta。这些系统的出现,对防止学术不端行为无疑会起到一个比较明显的效果。
在CNKI(http://check.cnki.net/Article/faq/Index.html#1)的服务服务专区,可以发解到,目前由于系统的敏感性,AMLC并不对学生开放,只对机构用户开放,对于研究生导师等科研人员,若能够签署单位盖章的协议,也可以使用该系统,但是是收费的。万方没有明确说明,但用户需要注册。(由于系统处于维护状态,我暂时没有注册成功)。
面对这些系统的开发,系统之外的一些问题也许更值得我们思考。
首先,尽管现在论文相似性判断方成已经有不少好的技术,但正如CNKI服务专区中对用户的回答一样,系统提供的检测结果只是判断论文可能抄袭的一个帮助,但是否抄袭还是要由专家通过人工来进行判断。因此在系统使用过程中一定要避免“唯系统论”。
第二,这些系统是为了发现论文是否存在抄袭现象,在使用的时间上要有所考虑。如一篇合格的硕士论文,要经过多次审查,对其是否达到硕士论文要求进行评价。如果学校使用这个系统检测,最好能够在外审之前就进行检测,如果相似度过高,经专家人工核实后,如果确实存在抄袭现象,就让学生修改。一篇期刊论文,先做个检测,再进入专家评审的阶段。这样做既发挥了它的作用,也能对抄袭行为有一个威慑作用。
第三,一篇硕士论文,少则三四万字,多则五六万。这注定一篇文章当中一定会用到别人的成果。为此,我们要对抄袭进行了一个明确的界定。如学术不端文献检测系统用户手册(http://check.cnki.net/可以下载)的第一部分对抄袭进行了如下界定:
1.1.1抄袭
1.1.1.1按抄袭的内容分类
(1)论点(结论、观点)抄袭
抄袭他人受著作权保护的作品中的论点、观点、结论。
(2)论据论证(实验和观测结果分析)抄袭
抄袭他人受著作权保护的作品中的论据、论证分析、科学实验(对象及方法)和观测结果及分析、科学调研、系统设计、问题的解决方法等等。
(3)表格数据抄袭
窃取他人研究成果中的调研、实验数据据为己有,或者照搬挪用他人以独创形式表现的数据,据为己有。
(4)图像图形抄袭
窃取他人研究成果中的独创性图像、实验图像据为己有,或者照搬挪用他人以独创形式表现的图像、图表,据为己有。
(5)概念(定义、原理、公式等)抄袭
窃取他人受著作权保护的作品中独创概念、定义、方法、原理、公式等据为己有。
(6)文章套改
套改他人作品的表述结构(或者情节),观点表达体系,参考文献等。
(7)引言抄袭
挪用剽窃他人作品引言(或绪论),包括研究工作的目的、范围、相关领域的前人工作和知识空白、理论基础和分析、研究设想、研究方法和实验设计、预期结果和意义等。
1.1.1.2 按抄袭文字的篇幅分类
(1)句子抄袭
其表现形式主要有:
A.整句照抄;
B.整句意思不变、句式不同。如:复合变为多个简单句;直接引用变为间接引用,“把”字句变为“被”字句,改变表达方式、修辞等。
C.整句意思不变、同义替换。
(2)段落抄袭
其表现形式主要有:
A.整段照搬。
B.稍改文字叙述,增删文句,实质内容不变。包括:段落的拆分合并,段落内句子顺序改变等等。
(3)章节抄袭
照搬或者基本照搬他人作品的某一章或几章内容。
(4)全篇抄袭
A.全文照搬。
B.删简(删除或简化):指将原文内容概括简化、删除引导性语句或删减原文中其他内容等。
C.替换:指替换应用或描述的对象。
D.改头换面:指改变原文文章结构、或改变原文顺序、或改变文字描述等。
E.增加:一是指简单的增加,即增加一些基础性概念或常识性知识等;二是指具有一定技术含量的增加,即在全包含原文内容的基础上,有新的分析和论述补充,或基于原文内容和分析发挥观点。
上面的界定有些是比较容易通过检测系统来完成,如整段、整章照搬。但整句的判断值得讨论。如在文章中引用前人的观点,引用前人的一些数据或图表,是抄袭还是引用就要仔细判断。“窃取他人受著作权保护的作品中独创概念、定义、方法、原理、公式等据为己有。”这一点如何来界定?
学术不端文献检测系统采用量化的数字规则为学术不端行为诊察提供帮助,目前提供的诊察规则如下:
1)轻度:重合文字大于1000字或重合百分比小于40%。
2)中度:重合文字大于5000字或重合百分比小于等于40%大于50%。
3)重度:重合文字大于10000字或重合百分比大于等于50%。
这些数字我们很容易理解,但重合文字大于1000字,是一篇硕士论文与一篇期刊论文的重合还是两篇硕士论文的重合?还是一篇硕士论文与CNKI中所有文献的重合文字数字。手册中没有看到具体说明,我也没有具体使用过系统,对此不好妄下判断。
第四,不管是同方还是万方,都是基于其现有资源和技术而开发的系统。对于一个用户而言,还可能存在这样一种情况:如果同方的检测没有问题,而万方的检测是有问题的,那么以哪一个为准。如果今后又出现了N个这样的检测系统,对用户而言则不是要试过每一个系统之后才能下结论。2009年在校研究生140.5万(中国统计数据库数据),每篇硕士论文按10元检测一次,那么其费用是1450万,如果国内所有期刊论文也通过检测,那么其金额会更加惊人。
细想一下,不诚信带来了一个本不存在市场,为此付出的代价是惊人的。学术不端行为林林总总,要彻底解决不是一朝一夕。面对抄袭,首先要有一个大家共同认可的标准,其此要加强诚信体系的建设,还有一个重要方面就是要加强学习,如让大家掌握合理引用的方法。
忽然想起了恩师叶继元教授的《学术规范通论》,有些内容虽然枯燥,但它对于了解做学术的一些基本知识还是非常有参考价值的。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 13:26
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社