李京哲的博客分享 http://blog.sciencenet.cn/u/sky613

博文

VOSviewer&CiteSpace:WoS数据清洗之如何将作者简写替换为全名?

已有 19058 次阅读 2016-11-13 15:08 |系统分类:科研笔记| vosviewer, CITESPACE, WOS, 数据清洗

一、作者字段分析存在的问题

   从WoS数据库下载的数据,作者字段有两种,分别是AUAF,AU是作者名字的简写,AF是作者全名,如“王欣”,在AU字段表示为Wang, X  而在AF字段表示为Wang, XinCiteSpaceVOSviewer在统计作者名字的时候默认统计AU字段,而不考虑作者ID,那么这就存在一定的问题,如软件统计出来Wang, X 出现频次为20次,但“Wang, Xin”本人可能只发文10篇,原因就是软件把Wang, Xing Wang, XinWang, Xiao等作者全部统计为Wang, X ,这时统计出来的数据就没什么信效度了。设想如果软件对AF字段也就是Wang, Xin进行统计,那么在很大程度上就可以避免重复,得到的数据就会有很高的可信度。


二、本博文,针对此问题,做出如下设想:可否让软件统计TXT中的AF字段?


三、经博主实践,得出如下解决方案:

1.先将AU替换其他符号或字母(TXT中绝对没有的,如 美元符号$

2.AF替换为AU

3.将第一步中代替AU的符号或字母替换为AF.


四、具体操作如下:


1.打开TXT(建议用Notepad++软件打开,可在本博客主页下载)见下图



2.选中全部数据(快捷键Ctrl A),进入查找和替换界面(快捷键Ctrl  F),点击替换



3.在查找目标栏输入AU,替换栏输入$ ,点击全部替换



4.在查找目标栏输入AF,替换栏输入AU ,点击全部替换



5.在查找目标栏输入$,替换栏输入AF,点击全部替换

这样一个TXT的作者AU AF替换就完成了

最后记得保存 ---- 点击 保存按钮 或 快捷键 Ctrl S


前后对比:



整理人:华东师范大学  李京哲




https://blog.sciencenet.cn/blog-3195540-1014506.html

上一篇:CiteSpace:如何打开已保存的Visualization文件?
下一篇:CNKI数据年份、期刊分布、作者、机构统计分析小技巧
收藏 IP: 180.160.52.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (3 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-21 21:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部