化柏林分享 http://blog.sciencenet.cn/u/huabolin

博文

面向学术问题的文本信息分析——中信所《情报分析技术》第九次课

已有 4239 次阅读 2011-5-10 09:00 |个人分类:文本分析|系统分类:教学心得| 文本信息分析, 学术问题

本次课探讨面向学术问题的文本信息分析,包括学术抄袭与科学引用检测系统,文献自动综述系统,基于学位论文致谢的导师评价系统。

学术抄袭检测系统与科学引用自动标注系统是一种技术,只不过应用不同而已,前者用于论文出手以后,后者用于论文出手以前;前者是“整人”的,后者是“帮人”的。每次写文章或写书,用于参考文献标注的时间都很多,如果有个系统能自动标注就好了。现在有一些参考文献管理软件,如EndNote, NoteExpress等,但是来自于哪个文献,标注在哪个地方,这些软件并不能自动实现。

抄袭检测系统把相同的句段检测出来,如果把文章的不同部分抽取来,集成到一起,不就形成文献自动综述?每一个主题都有成百上千篇论文,这些论文中又有很多相同的部分,如果把相同部分滤掉,不同部分重组不就形成了文献自动综述?

基于学位论文致谢可以对导师的风格进行评价。对学位论文致谢中的形容词与副词(大部分是四字成语)进行词频统计确定导师的特点。致谢中大都使用褒义词或中性词,很少会有贬义词。但是褒义词的数量、侧重会有所不同。

以上这些系统说到底,也是检索与计量分析的问题,而检索与计量是情报学的两大支柱。

 

点击下载:

第九讲 面向学术问题的文本信息分析.pdf



https://blog.sciencenet.cn/blog-91591-442473.html

上一篇:计量分析类论文如何创新?
下一篇:面向传统文化的文本信息分析——中信所《情报分析技术》第十次课
收藏 IP: 168.160.23.*| 热度|

2 刘耀 贡金涛

发表评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 20:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部