|||
本次课探讨面向学术问题的文本信息分析,包括学术抄袭与科学引用检测系统,文献自动综述系统,基于学位论文致谢的导师评价系统。
学术抄袭检测系统与科学引用自动标注系统是一种技术,只不过应用不同而已,前者用于论文出手以后,后者用于论文出手以前;前者是“整人”的,后者是“帮人”的。每次写文章或写书,用于参考文献标注的时间都很多,如果有个系统能自动标注就好了。现在有一些参考文献管理软件,如EndNote, NoteExpress等,但是来自于哪个文献,标注在哪个地方,这些软件并不能自动实现。
抄袭检测系统把相同的句段检测出来,如果把文章的不同部分抽取来,集成到一起,不就形成文献自动综述?每一个主题都有成百上千篇论文,这些论文中又有很多相同的部分,如果把相同部分滤掉,不同部分重组不就形成了文献自动综述?
基于学位论文致谢可以对导师的风格进行评价。对学位论文致谢中的形容词与副词(大部分是四字成语)进行词频统计确定导师的特点。致谢中大都使用褒义词或中性词,很少会有贬义词。但是褒义词的数量、侧重会有所不同。
以上这些系统说到底,也是检索与计量分析的问题,而检索与计量是情报学的两大支柱。
点击下载:
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-27 06:20
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社