PingFucwu的个人博客分享 http://blog.sciencenet.cn/u/PingFucwu

博文

使用文本挖掘工具对专有数据库的数据进行热门话题研究

已有 1047 次阅读 2021-12-29 19:46 |系统分类:科研笔记

        上次我在关于如何撰写期刊论文方法一章中提到过一些专有数据库厂商开发提供的文本和数据挖掘工具(text&data mining tools),使用这些工具可以对专有数据库的数据进行热门话题研究。比如Jstor Constellate。我们学校作为合作伙伴,我参加过Jstor Constellate的培训。可以使用Jupiter networks和Python语言对Jstor的文献进行大数据处理和分析,提炼元数据(metadata and pre-processing)预处理,字数频率的(word frequency)处理,重要的术语(significant term)提炼,提炼出主题模型(topic modeling)。其他厂商也有类似的产品如ProQuest的TDM studio。对国内的产品不了解,有了解可以介绍一下。这些工具还可以用于数字人文项目的研究,比如某个时间跨越段对某个主题有多少篇学术论文等,主题是啥等等,可以看出趋势和进行归纳总结。



https://blog.sciencenet.cn/blog-3316383-1318712.html

上一篇:今天接种了新冠疫苗加强针第三针
下一篇:美国一月三号新冠感染人超100万创历史记录

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2022-5-23 14:14

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部