|||
:我们以一篇公开发表的论文中的矩阵作为例子,说明战略坐标的计算方法。数据来自于邱均平 等 关于共被引分析方法的再认识和再思考 情报学报 2008 27(1):69— 74
数字是二者同被引次数,仅作为说明计算方法用,结果不具有实际意义。
此处对角线的数据是邱老师原文中按照共现最大次数+1计算的。
王崇德 | 邱均平 | 罗式胜 | 蒋国华 | 赵红洲 | 梁立明 | 张琪玉 | 赖茂生 | 陈光祚 | 曾民族 | 侯汉清 | 焦玉英 | |
王崇德 | 230.00 | 229.00 | 72.00 | 20.00 | 7.00 | 6.00 | 7.00 | 6.00 | 5.00 | 3.00 | 3.00 | l |
邱均平 | 229.00 | 230.00 | l12 | l7 | 9.00 | 24.00 | l | 6.00 | lO | 7.00 | l | 2.00 |
罗式胜 | 72.00 | l12 | l13 | l5 | 2.00 | lO | 2.00 | 9.00 | 2.00 | 2.00 | l | O |
蒋国华 | 20.00 | l7 | l5 | 3l | 26.00 | 30.00 | O | l | O | O | O | O |
赵红洲 | 7.00 | 9.00 | 2.00 | 26.00 | 27.00 | 3.00 | l | O | l | O | O | O |
梁立明 | 6.00 | 24.00 | lO | 30.00 | 3.00 | 3l | O | O | O | O | O | O |
张琪玉 | 7.00 | l | 2.00 | O | l | O | l48 | 30.00 | 40.00 | 9.00 | l47 | l9 |
赖茂生 | 6.00 | 6.00 | 9.00 | l | O | O | 30.00 | 32.00 | 3l | l7 | l7 | 9.00 |
陈光祚 | 5.00 | lO | 2.00 | O | l | O | 40.00 | 3l | 4l | 27.00 | l4 | l7 |
曾民族 | 3.00 | 7.00 | 2.00 | O | O | O | 9.00 | l7 | 27.00 | 28.00 | 3.00 | 5.00 |
侯汉清 | 3.00 | l | l | O | O | O | l47 | l7 | l4 | 3.00 | 148.00 | 7.00 |
焦玉英 | l | 2.00 | O | O | O | O | l9 | 9.00 | l7 | 5.00 | 7.00 | 20.00 |
在下面的矩阵中做了修改,对角线上的数据用共现总次数代替了。
|
王崇德 |
邱均平 |
罗式胜 |
蒋国华 |
赵红洲 |
梁立明 |
张琪玉 |
赖茂生 |
陈光祚 |
曾民族 |
侯汉清 |
焦玉英 |
王崇德 |
359.00 |
229.00 |
72.00 |
20.00 |
7.00 |
6.00 |
7.00 |
6.00 |
5.00 |
3.00 |
3.00 |
1.00 |
邱均平 |
229.00 |
418.00 |
112.00 |
17.00 |
9.00 |
24.00 |
1.00 |
6.00 |
10.00 |
7.00 |
1.00 |
2.00 |
罗式胜 |
72.00 |
112.00 |
227.00 |
15.00 |
2.00 |
10.00 |
2.00 |
9.00 |
2.00 |
2.00 |
1.00 |
0.00 |
蒋国华 |
20.00 |
17.00 |
15.00 |
108.00 |
26.00 |
30.00 |
0.00 |
1.00 |
0.00 |
0.00 |
0.00 |
0.00 |
赵红洲 |
7.00 |
9.00 |
2.00 |
26.00 |
49.00 |
3.00 |
1.00 |
0.00 |
1.00 |
0.00 |
0.00 |
0.00 |
梁立明 |
6.00 |
24.00 |
10.00 |
30.00 |
3.00 |
73.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
0.00 |
张琪玉 |
7.00 |
1.00 |
2.00 |
0.00 |
1.00 |
0.00 |
256.00 |
30.00 |
40.00 |
9.00 |
147.00 |
19.00 |
赖茂生 |
6.00 |
6.00 |
9.00 |
0.00 |
0.00 |
0.00 |
30.00 |
126.00 |
31.00 |
17.00 |
17.00 |
9.00 |
陈光祚 |
5.00 |
10.00 |
2.00 |
0.00 |
1.00 |
0.00 |
40.00 |
31.00 |
147.00 |
27.00 |
14.00 |
17.00 |
曾民族 |
3.00 |
7.00 |
2.00 |
0.00 |
0.00 |
0.00 |
9.00 |
17.00 |
27.00 |
73.00 |
3.00 |
5.00 |
侯汉清 |
3.00 |
1.00 |
1.00 |
0.00 |
0.00 |
0.00 |
147.00 |
17.00 |
14.00 |
3.00 |
193.00 |
7.00 |
焦玉英 |
1.00 |
2.00 |
0.00 |
0.00 |
0.00 |
0.00 |
19.00 |
9.00 |
17.00 |
5.00 |
7.00 |
60.00 |
总计 |
359.00 |
418.00 |
227.00 |
108.00 |
49.00 |
73.00 |
256.00 |
126.00 | 147.00 | 73.00 | 193.00 | 60.00 |
聚类分析 | |||
SPSS | |||
classify | |||
Hierarchical cluster | |||
method: | count | chi-square | furthest |
plot: | dendrogram |
结果如下:
根据聚类分析结果 标志每个对象的组别,见下图的最右边一列。
王崇德 | 邱均平 | 罗式胜 | 蒋国华 | 赵红洲 | 梁立明 | 张琪玉 | 赖茂生 | 陈光祚 | 曾民族 | 侯汉清 | 焦玉英 | 聚类分组 | ||
1 | 王崇德 | 359.00 | 229.00 | 72.00 | 20.00 | 7.00 | 6.00 | 7.00 | 6.00 | 5.00 | 3.00 | 3.00 | 1.00 | D |
2 | 邱均平 | 229.00 | 418.00 | 112.00 | 17.00 | 9.00 | 24.00 | 1.00 | 6.00 | 10.00 | 7.00 | 1.00 | 2.00 | D |
3 | 罗式胜 | 72.00 | 112.00 | 227.00 | 15.00 | 2.00 | 10.00 | 2.00 | 9.00 | 2.00 | 2.00 | 1.00 | 0.00 | D |
4 | 蒋国华 | 20.00 | 17.00 | 15.00 | 108.00 | 26.00 | 30.00 | 0.00 | 1.00 | 0.00 | 0.00 | 0.00 | 0.00 | C |
5 | 赵红洲 | 7.00 | 9.00 | 2.00 | 26.00 | 49.00 | 3.00 | 1.00 | 0.00 | 1.00 | 0.00 | 0.00 | 0.00 | C |
6 | 梁立明 | 6.00 | 24.00 | 10.00 | 30.00 | 3.00 | 73.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | C |
7 | 张琪玉 | 7.00 | 1.00 | 2.00 | 0.00 | 1.00 | 0.00 | 256.00 | 30.00 | 40.00 | 9.00 | 147.00 | 19.00 | A |
8 | 赖茂生 | 6.00 | 6.00 | 9.00 | 0.00 | 0.00 | 0.00 | 30.00 | 126.00 | 31.00 | 17.00 | 17.00 | 9.00 | B |
9 | 陈光祚 | 5.00 | 10.00 | 2.00 | 0.00 | 1.00 | 0.00 | 40.00 | 31.00 | 147.00 | 27.00 | 14.00 | 17.00 | B |
10 | 曾民族 | 3.00 | 7.00 | 2.00 | 0.00 | 0.00 | 0.00 | 9.00 | 17.00 | 27.00 | 73.00 | 3.00 | 5.00 | B |
11 | 侯汉清 | 3.00 | 1.00 | 1.00 | 0.00 | 0.00 | 0.00 | 147.00 | 17.00 | 14.00 | 3.00 | 193.00 | 7.00 | A |
12 | 焦玉英 | 1.00 | 2.00 | 0.00 | 0.00 | 0.00 | 0.00 | 19.00 | 9.00 | 17.00 | 5.00 | 7.00 | 60.00 | B |
在excel中,按照聚类分组排序各行,如下图:
王崇德 | 邱均平 | 罗式胜 | 蒋国华 | 赵红洲 | 梁立明 | 张琪玉 | 赖茂生 | 陈光祚 | 曾民族 | 侯汉清 | 焦玉英 | 聚类分组 | ||
7 | 张琪玉 | 7.00 | 1.00 | 2.00 | 0.00 | 1.00 | 0.00 | 256.00 | 30.00 | 40.00 | 9.00 | 147.00 | 19.00 | A |
11 | 侯汉清 | 3.00 | 1.00 | 1.00 | 0.00 | 0.00 | 0.00 | 147.00 | 17.00 | 14.00 | 3.00 | 193.00 | 7.00 | A |
8 | 赖茂生 | 6.00 | 6.00 | 9.00 | 0.00 | 0.00 | 0.00 | 30.00 | 126.00 | 31.00 | 17.00 | 17.00 | 9.00 | B |
9 | 陈光祚 | 5.00 | 10.00 | 2.00 | 0.00 | 1.00 | 0.00 | 40.00 | 31.00 | 147.00 | 27.00 | 14.00 | 17.00 | B |
10 | 曾民族 | 3.00 | 7.00 | 2.00 | 0.00 | 0.00 | 0.00 | 9.00 | 17.00 | 27.00 | 73.00 | 3.00 | 5.00 | B |
12 | 焦玉英 | 1.00 | 2.00 | 0.00 | 0.00 | 0.00 | 0.00 | 19.00 | 9.00 | 17.00 | 5.00 | 7.00 | 60.00 | B |
4 | 蒋国华 | 20.00 | 17.00 | 15.00 | 108.00 | 26.00 | 30.00 | 0.00 | 1.00 | 0.00 | 0.00 | 0.00 | 0.00 | C |
5 | 赵红洲 | 7.00 | 9.00 | 2.00 | 26.00 | 49.00 | 3.00 | 1.00 | 0.00 | 1.00 | 0.00 | 0.00 | 0.00 | C |
6 | 梁立明 | 6.00 | 24.00 | 10.00 | 30.00 | 3.00 | 73.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | 0.00 | C |
1 | 王崇德 | 359.00 | 229.00 | 72.00 | 20.00 | 7.00 | 6.00 | 7.00 | 6.00 | 5.00 | 3.00 | 3.00 | 1.00 | D |
2 | 邱均平 | 229.00 | 418.00 | 112.00 | 17.00 | 9.00 | 24.00 | 1.00 | 6.00 | 10.00 | 7.00 | 1.00 | 2.00 | D |
3 | 罗式胜 | 72.00 | 112.00 | 227.00 | 15.00 | 2.00 | 10.00 | 2.00 | 9.00 | 2.00 | 2.00 | 1.00 | 0.00 | D |
如果计算B组的密度,则只保留同组的(赖茂生,陈光祚,曾民族),删除其他各列:
赖茂生 | 陈光祚 | 曾民族 | 焦玉英 |
合计: |
||
8 | 赖茂生 | 0.00 | 31.00 | 17.00 | 9.00 | 57.00 |
9 | 陈光祚 | 31.00 | 0.00 | 27.00 | 17.00 | 75.00 |
10 | 曾民族 | 17.00 | 27.00 | 0.00 | 5.00 | 49.00 |
12 | 焦玉英 | 9.00 | 17.00 | 5.00 | 0.00 | 31.00 |
把对角线的数字替换为0,求每一行的和(上图中的最右一列)。然后求这些和的均值,此处为53.
王崇德 | 邱均平 | 罗式胜 | 蒋国华 | 赵红洲 | 梁立明 | 张琪玉 | 侯汉清 | 合计 | ||
8 | 赖茂生 | 6.00 | 6.00 | 9.00 | 0.00 | 0.00 | 0.00 | 30.00 | 17.00 | 68.00 |
9 | 陈光祚 | 5.00 | 10.00 | 2.00 | 0.00 | 1.00 | 0.00 | 40.00 | 14.00 | 72.00 |
10 | 曾民族 | 3.00 | 7.00 | 2.00 | 0.00 | 0.00 | 0.00 | 9.00 | 3.00 | 24.00 |
12 | 焦玉英 | 1.00 | 2.00 | 0.00 | 0.00 | 0.00 | 0.00 | 19.00 | 7.00 | 29.00 |
均值 | 48.25 |
如果求B组的向心度,则删除同组的列,然后求每一行的和,这些和的均值就是B组的向心度,此处是48.25。
如此,求出每一组的向心度和密度……,求各组的向心度和密度的均值,以此作为坐标的原点
A | B | C | D | 均值M(坐标的原点) | |
密度 | 53 | ||||
向心度 | 48.25 |
具体坐标值:
A的坐标 | B的坐标 | C的坐标 | D的坐标 | |
密度 | A-密度均值 | B-密度均值 | ||
向心度 | A-向心度均值 | B-向心度均值 |
最后的结果是这样的:
战略坐标用于共词分析,这里的数据则是同被引的数据,所以其对战略坐标的解释还需要慎重。下面的解释权当做戏说:
密度最高的是王崇德和邱均平,文献计量学,内部联系密切;但是向心度低,与其他研究题目不密切,或者不是中心性的课题,
向心度最高的是张琪玉和侯汉清,检索语言,很多学科都和他们有联系,但是从密度上看,研究课题的内部不是很密切,但是也高于其余两组。
蒋国华等人的研究题目内部联系也不是很密切,同时与其他研究题目关系也不密切;赖茂生等人的研究课题更接近中心一点,即与其他研究关系比较密切,同时,自身的密度也稍微高于蒋国华等人的研究领域。
切记,对应的是这些研究者的研究主题,而不是研究者本人。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-22 00:15
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社