||
张小鹏把最新的SCI影响因子贴了出来。我想看看Thomson Reuters公司收录的这些主流杂志喜欢用什么词作杂志名。我把8411个杂志的名称混合起来,对词频进行排序,发现SCI(science)出现频率最高,是537次。RES(research)、INT(internatinal)依次递减。对于各个专业,医学杂志最多,其次是工程、化学、临床、数学、生物和物理等(图1)。图1中纵坐标是单词出现的频率。
图1. 2012年SCI杂志名称的词频排序
我还有一个2009年的SCI杂志影响因子库,其中有杂志名的全称。这个库只有5971个杂志。
同样几个虚词(journal、research、science)频率最高。专业类engineering第一,medicine第二,chemistry第三。区域类American第一,European第二(图2)。
图2. 2009年SCI杂志名称的词频排序
画图的R语言代码如下:
JJ = read.table('clipboard', header=F, sep='t') #拷贝Excel表中的文件名,读入JJ
SS = c(unlist(strsplit(as.character(JJ[1:nrow(JJ),1]), ' '))) #分词
par(mfrow=c(2,1)) #设定图的排列方式
barplot(sort(table(SS), decreasing = T)[ 2:21],cex.axis=.8, cex.name=.8, main='Rank 1-20')
barplot(sort(table(SS), decreasing = T)[22:41],cex.axis=.8, cex.name=.8, main='Rank 21-40')
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-26 19:31
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社