|||
CiteSpace的用户在科学网的留言板上提问已经超过3,600多条。许多问题其实是非常类似甚至是完全相同而且前面已经回答过,只是留言板上好像不能有效地搜索前面的问题和答案。
我计划把用户常见问题和解答分类组织归纳为这篇博客,至少各位都可以在同一页上搜索。问题和答案将按流程中的步骤分类, 如关于问题8.23就应该是个聚类方面的问题。CiteSpace用户提问之前可以先在本页搜索一下相关问题。 如果没有找到现有答案,再去留言板提问。如果现有问题不完全适用,提问时标明现有问题的编号,以便我进一步更新完善。
由于这个归纳整理将花费很多时间,我只能采用蚂蚁搬家的办法,不定期地更新本页。欢迎提供问题和解答。
问题分类
0. 出现问题怎么办?
从哪里下载软件?
安装,启动,运行
数据格式(英文)
数据格式(中文)
参数设置与调整
节点类型和选择标准
图谱
聚类
Burstness
地图叠加
网络叠加
双图叠加
网络分析
文本分析
数据库接口
报告输出
问题和解答
0. 出现问题怎么办?
查看命令行窗口,CiteSpace遇到问题是会显示一些相关信息。提问的时候把这里显示的信息包括在你的问题中。CiteSpace提供了几个Demo的样本。如果你自己的数据出现问题,而CiteSpace自带的范例运行正常,则你的问题和你的数据本身有关,比如数据格式有所变更。你可以自行比较以下两组数据格式上有无差异。你也可以在你提问的时候提供一两条你的数据样本。
留言板上好像无法帖图,可在相关的“主题”下提供具体细节。
留言板上提问时给出下列信息以便答复。避免笼统的提问。
最基本的所需信息:你的操作系统,CiteSpace的版本,数据来源。
1. 从哪里下载CiteSpace软件?
Q1.1 从哪里下载最新版本?
A1.1 最新版本以SourceForge上所提供的下载版本为准:
https://sourceforge.net/projects/citespace/
如果你用Windows,可下载.exe文件。如果用其他系统,下载.7z文件。
Q1.2 CiteSpace软件是免费下载和使用吗?
A1.2 是。
Q1.3 CiteSpace软件有有效期吗?
A1.3 有。一般为每个版本发布之后的3-12个月,主要目的为版本更新。以前也有少数无限期特例以配合会议或培训活动。
2. 安装,启动, 运行
Q2.1 电脑是32位系统,安装了32位的java。还能用CiteSpace吗?
A2.1:能。32位系统在内存使用上有限制。文本编辑一下StartCiteSpace.bat: 把里面的12g换成4g或更小的2g 或1g。
Q2.2 下载的安装包都解压不了会是啥问题呢?
A2.2:用7z.
Q2.3 导入数据时候,节点类型选择cited reference,数据加载不成功,到某一年度就停止了。
A2.3: 1) 内存不足 2)数据格式有问题。如果是2),查看命令行里显示的文件名和行号,可在数据文件中直接修正格式问题,同时把具体问题反馈给我。
Mac OS
请参考下面的介绍。感谢作者“在天大读博”:https://zhuanlan.zhihu.com/p/45630813
Q2.4 mac上不能运行.bat批处理文件,那么有没有针对mac的citespace优化启动方案呢?直接点jar启动,是无法修改内存的。
A2.2:mac上的批处理文件可以用shell script.
3. 数据格式(英文)
Q3.1 我在wos搜索到一共2183篇文献,分了五次下载,进行合并,然后发现虽然合并后的文档是完整的(每个年份的文献数量都与网上相符合,也有参考文献之类的词条),但是放入软件运行后,软件只能显示出合并时放在第一位的文档里的文献,其余的文献都显示不出来,我尝试把要合并的文档调整顺序,还是只能显示放在第一位的文档里的文献,请问这是合并时出现的问题还是软件的问题。
A3.1: 这种情况不需要合并。也不需要去重。
4. 数据格式(中文)
Q4.1 因为从cnki下载的数据不包含reference,因而不能做文献共被引分析。学生想问:能否通过在download_XX.txt文件当中手动添加参考文献,从而做共被引分析?麻烦老师了。
A4.1:可以。只要格式对了就行。参考WoS格式。只是手动还需要些毅力。
5. 参数设置与调整
Q5.1 项目参数设置页面的e是什么参数?这个参数修改一下对分析结果的影响很大,但不知是什么含义。
A5.1 参数e是对TopN所选节点的被引次数的附加条件,满足这一条件的节点才能入选后续分析。例如,TopN=30, e=2组合起来的意思是在每个时间切片中选取被引次数最高的30阶层。如果有多个记录具有相同的被引次数,这些记录都视为满足条件。 参数e的作用是进一步要求每条选中的记录至少被引了e次。 如果TopN所选的所有记录的被引次数都大于或等于e,这是参数e没有影响。如果TopN所选的记录中有些没有达到e,这些记录就会被过滤于掉。
Q5.2 在做引文分析时,对阈值(Thresholds)进行参数设定时,默认参数值有三组(2,2,20)(4,3,20)(4,3,20),请问您这其中的一组参数如(2,2,20)代表一个时期中c,cc,ccv,的参数,还是这一组参数代表c的前中后三个时期的参数呢?我设置years Per Slice为1,那么上面阈值的前中后期是代表一年中的前中后吗?因为我发现改变阈值参数对节点数据有很大的影响。
A5.2 三组数值各对应于整个时间区的第一段(年),最中间一段(年),和最后一段(年),其余各段(年)用线性插值设置。最后一组如果是近年的考虑采用相对低一些的数值。
Q5.3 我设置参数的时候topN中的N我设置的是50,研究的节点类型是关键词,为什么点go之后出来的关键词并不止50个呢
A5.3. 这里的N=50指的是频次最高的50个值。每一个值允许多个满足条件的节点。比如被引恰好100次的论文可能多于一篇,所以最终结果可以大于50篇。
6. 节点类型和选择标准
7. 图谱
Q7.1 成图之后标签重叠,为什么移动节点标签不动是因为什么原因呢?
我调整节点位置之后,节点名称没有跟着一起移动,怎么解决这个问题?
A7.1 右下脚有个Avoid Overlapping Node Labels,重选一次就可以了。
Q7.2 有一个节点名称乱码了,能修改名称吗?如果可以的话,请问怎么修改?
A7.2 用citespace.alias文件替换。 新名称 tab 乱码名称。
Q7.3 centrality都显示为0怎么办?
A7.3 见主界面菜单:Preferences > Defer the calculation of centrality
8. 聚类
Q8.1 我在进行聚类分析的时候,为什么界面右上方显示cluster个数为9个,而聚类图像实际显示只有0-7?
A8.1 系统自动显示含有10个成员以上的聚类。而不满足这个条件的聚类则不显示。
用户可以调整这个限制:
1。Display > Clusters > Set the Minimum Visible Cluster Size => 1
2。Filters > Show the Largest Connected Component Only => off
Q8.2 聚类后有两个聚类标签是一样的?这该怎么处理呢?
A8.2 用LLR. Clusters > 2. Label Clusters > Cast by Top N% Citers => 100%.
Q8.3 为什么我cited reference分析一个83-14年的wos数据,,聚类后只有0、2、6、25、这四个编号,并且还不连续?是数据本身的问题吗???
A8.3 两种情况:
1。聚类成员的个数低于预先设定的最低水平。clusters菜单下可调整。
2。聚类不属于最大k个连同子网络。可调整k值。
Q8.4 聚类分析以后的标签重叠在一起,怎么才能不重叠呢?
A8.4 Control Panel > Labels > Avoid Overlapping Labels。
9. Burst Detection
Q9.1 在Citations burst history 中有几篇文献被引的时间早于文献发表的时间,例如
References Year Strength Begin End
GROSS GJ 1993 4.81 1992 2005
KONING MMG 1994 3.61 1992 2005
KONING MMG 1995 3.40 1992 2001
请问这是什么原因呢?谢谢陈老师!
A9.1 我的回复(2018-5-28 07:09):第一年里要确实有数据。另外,这类问题在5.3.R3已经解决。
13. 网络分析
Q13.1 哪些数据可以做引文分析?
A13.1 有引文数据的包括:Web of Science, Scopus, CSCD, CSSCI. 没有的包括:CNKI, PubMed
Q13.2 我看了一些文献有介绍到网络密度这一指标,好像目前没看到一个类似于m、s值的具体标准;网络密度多少才算松散,多少才算紧密呢?
A13.2 一般常见的办法是以随机生成的网络为参考来判断多或少。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-27 15:02
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社