heruspex的个人博客分享 http://blog.sciencenet.cn/u/heruspex

博文

查重:大论文的关键一环 精选

已有 14923 次阅读 2023-1-26 10:21 |系统分类:论文交流

        查重,大论文需要查重吗?这本不该是个事。因为如果是科研为导向,在写大论文即毕业论文前,学生已经通过一系列科技论文的撰写和发表,为自己奠定了坚实的论文写作能力。文章的大多数内容是来自和翻译自自己早先写的文章,重没重是相当门清的。论文里的素材是不是自己的内容,也非常清楚。唯一需要注意检查的是,大论文里的综述部分。

        但如果前期研究生的能力培养没做好合理搭配,大论文不进行查重就有极大的风险,尤其对于那些进校时就把方向定位在工程而非科研的研究生来说。

        主要的风险是会引出学术不端。但是,偏偏有不少学生、甚至导师也不以为然,认为只要学生能毕业就行了。然而,如果查重率高或存在学术不端,这个问题实际上是颗定时炸弹,即使是毕业时侥幸没爆,未来也可能在抽查中爆出来。一旦查出,不仅自己的学位有可能被取消,导师也有可能要承担连带责任,受到停招研究生的处分,以至影响整个实验室的良序发展。

        所以,从学校的角度,为了避免这种情况的发生,往往在论文送盲审之前,会增加一道预审环节,一方面保证学生送出去的大论文在学术方面是合格的,另一方面也是防止大论文出现学术不端问题。

        要进行查重,学校一般会通过知网(英名缩写CNKI,全称为中国国家知识基础设施)。学生自己也可以用知网或其它查重软件,如中国学术不端查重检测系统。这些查重系统里面其实都蕴含了人工智能和大数据的技术。一是有查重必需的大数据,由海量的、先前发表过的期刊、会议、研究生/本科生毕业论文、图书、专利、报纸甚至互联网数据组成。数据库越全,查重的可靠性越高。二是人工智能技术的运用,既能帮助进行快速的匹配,又能实现准确查重。

       但是,现有的查重系统也并非完全尽善尽美,因此,漏网之鱼还是存在的。比如,不同语种之间相似内容的查重,可能还很难发现是否是抄袭的。这方面仍然需要人工来操作。还有图表的查重,也存在一些局限性,毕竟识别图像上的重复性需要更高层次的认知理解。这些都要求学生有高的学术道德标准,不要抱侥幸心理,毕竟技术一直是在发展的,现在发现不了,不意味着今后发现不了。更何况,还有人工查重、毕业十年后盲审大论文的时候在等着。

        另外,在查重时,也需要避免一些坑,主要是市面上可能存在某些不良的查重机构。如果不假思索地、毫无保留地提交自己的论文到这些机构,有可能自己的文章被卖掉了或被其它人发表了也说不定。那时,就真的是,哑巴吃黄连,有苦说不出了。

        那么,查重系统能帮助发现哪些不该出现的问题呢?哪些又是查重系统警示了但可以忽略的呢?对一个大论文来说,查重率在多少范围以内是可以容忍的呢?

        查重,顾名思义,就是检查重复度。系统能发现的,一般来说,有五种情况。第一种是整段重复的,这是查重系统最容易发现的,也是最需要避免的。第二种是拼接重复的。其重复可能来自若干篇已有文献,但相对零散。系统会给出每句话的来源。第三种是高度类似。比如在语句中存在局部字词相似,但整体上并没显示出高度重复性。第四种是写的语句源自某篇文献,但却没有进行引用。第五种是参考文献上的重复,这种情况往往可以忽略。

       为什么会出现第一种重复呢?如果早十几年前,也不一定被认为是大事。因为那时国内的学术规范还没走上正轨,大家都在学习阶段。而现今的学术环境,已经不可同日而语。出现这种重复的原因,有两种。一是偷懒,二是没有消化吸收。大论文是自己工作的总结,内在的行文逻辑都应该是自己的。大段重复,意味着逻辑在这里会被硬生生打断了,换成了别人的行文逻辑。要避免这种情况,就应该把别人论文里的内容,通过自己的理解,再用自己的语言重新表述出来,以便保持行文逻辑的一致性。

        如果学生不认真写,没有从理解的角度来写。那意味着导师要花更长的时间来帮助检查,甚至帮助重新撰写疑似重复的段落。这是相当不合算的。因为导师的经验本应该用于帮助提升学生的创新能力上,现在却在帮着“擦屁股”,确保大论文的语文能及格。

       大段重复,还有一种情况,是源自自己已经发表过的论文,比如综述论文。这种情况下,理论上可以沿用原文。但如果已经发表了一段时间,需要达到学校的要求, 即降低重复率的话,也不妨考虑重组文字的表述。

        简单来说,对第一种情况的处理,要做到,正确引用、消化吸收、逻辑保持一致。

        相对于第一种情况,后四种都可以类似处理。需要注意的是第四种,没有引用的,一定要补上引用,并指出本文与原引用文章的区别,否则就是学术不端。因为,有可能大论文的某些创新是源自此引用文献。但作者却通过有意忽略此文献,来“提升”大论文的创新性。如果仅是综述部分的文献忽略,那补充文献,并保持行文有自己的逻辑即可。

        再说下查重率?这个似乎每个高校有其各自的标准,并不统一。对博士、硕士、工程硕士等也都有不一样的标准。一般来说,查重率不能高于20%,部分高校要求不能超过10%或7%。但从严格意义来说,个人以为,低于3%才是安全的。它意味着论文中不会出现大段的重复,文字的表述有自己的逻辑。否则,都还是有可能会出现以上的五种情况。

        据说在降重方面,有些歪门邪道的办法,可以骗过人工智能和大数据的查重。但这么做,改变不了论文存在学术不端的问题,迟早会暴露。所以,还是得端正态度,认真且真正按学术规范来降低重复率。

       另外,除了大论文上有查重的问题,还有两种文章也特别容易出现与大论文类似的问题,需要小心。一是不同单位一起合作写论文的时候,尤其是综述型的论文。二是合作写编著的书籍。因为参与单位多,学生也多,如果不认真,很容易导致千里之堤,毁于蚁穴的情况。即很可能会以一已之力让整篇论文和合作者获得不好的声誉。

        从学术规范的角度来看,这种事的发生多少反映了合作者和参与者的上心程度,有的时候还不一定是写不写得好的问题。好的合作者,应该会全方位全细节把控好。即便不是主导者,也会把自己的责任明晰。关于这种情况,我一直记得我导师的教诲:“你可以被忽悠一次,就当认识人”。

2023年1月26日

张军平



论文写作
https://blog.sciencenet.cn/blog-3389532-1373511.html

上一篇:有组织科研:形散而神不散
下一篇:成体系:大论文的另一关键环节
收藏 IP: 116.230.95.*| 热度|

10 许培扬 郑永军 王安良 周忠浩 彭真明 彭振华 郑强 雷宏江 马臻 崔锦华

该博文允许注册用户评论 请点击登录 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-21 19:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部