按照我的风格,悄悄地把BICOMB发布出去了。已经有10多位同学跟我要软件了。低调是我一贯的做法,就是想给几位关注这个方法的同道们一起分享这个工具,如同几位好友一起品酒喝茶,不需要喧嚣,和轰轰烈烈。
不知道这茶几位喝着感觉如何,我先自己曝一曝它的不足吧:
1. 还有很多有意义的共现项目没有抽取和统计,比如论文作者: 中文的CNKI算法可以处理一篇论文有多个作者的情况,每一位作者分别计数,同时可以生成它们共现的矩阵。这样我们就可以分析某文献集合中作者的合著情况。 但是,对于PubMed的论文作者,WOS的作者,SCI CD-ROM的作者,多个作者只提取一个,不能做合著分析。
2. 管理员项目中,对管理员添加自定义格式的设定,只能整行的提取出来,用户设置第二个节点不能达到抽取和分割该字段的目的,比如对WOS记录中发表论文的多个作者提取时候,输入分隔符“;”不能把作者分开。又比如,对WOS记录,自定义字段DE进行提取,输入节点1为DE,节点2为“;”但是,结果只能整行提取,且只取一行,每一行有多个项目用“;”分隔,不能抽取出来。
3. 由于CNKI早年的记录中“著者单位”的格式 比较混乱,对作者单位的统计中,如下面样例所示,两个单位中间没有分隔符“;”,而且单位太长,所以没有统计出来。如:单位:中国医科大学信息管理与信息系统(医学)系,《中国临床医学影像杂志》编辑部 沈阳 110001,沈阳 110004
4. CNKI中同类项归并问题:
关键词统计中,同义词是否可以留有一个归并的界面,把“Internet”和“因特网”两个作为一个词统计,包括共现矩阵的生成。
期刊名统计中,两种期刊(期刊改名前后)也可以归并为一个。对于单位名称,同一单位的不同称呼,也要归并到一起。
https://blog.sciencenet.cn/blog-82196-302140.html
上一篇:
BICOMB软件下一篇:
春日暖洋洋