崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

如何计算战略坐标

已有 13574 次阅读 2010-4-16 11:04 |个人分类:生物医学文本挖掘|系统分类:论文交流| 计算方法, 战略坐标, 共现矩阵

:我们以一篇公开发表的论文中的矩阵作为例子,说明战略坐标的计算方法。数据来自于邱均平 等 关于共被引分析方法的再认识和再思考 情报学报 2008 27(1):69— 74

数字是二者同被引次数,仅作为说明计算方法用,结果不具有实际意义。

此处对角线的数据是邱老师原文中按照共现最大次数+1计算的。

 

  王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英
王崇德 230.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 l
邱均平 229.00 230.00 l12 l7 9.00 24.00 l 6.00 lO 7.00 l 2.00
罗式胜 72.00 l12 l13 l5 2.00 lO 2.00 9.00 2.00 2.00 l O
蒋国华 20.00 l7 l5 3l 26.00 30.00 O l O O O O
赵红洲 7.00 9.00 2.00 26.00 27.00 3.00 l O l O O O
梁立明 6.00 24.00 lO 30.00 3.00 3l O O O O O O
张琪玉 7.00 l 2.00 O l O l48 30.00 40.00 9.00 l47 l9
赖茂生 6.00 6.00 9.00 l O O 30.00 32.00 3l l7 l7 9.00
陈光祚 5.00 lO 2.00 O l O 40.00 3l 4l 27.00 l4 l7
曾民族 3.00 7.00 2.00 O O O 9.00 l7 27.00 28.00 3.00 5.00
侯汉清 3.00 l l O O O l47 l7 l4 3.00 148.00 7.00
焦玉英 l 2.00 O O O O l9 9.00 l7 5.00 7.00 20.00

 

在下面的矩阵中做了修改,对角线上的数据用共现总次数代替了。

 

 

王崇德

邱均平

罗式胜

蒋国华

赵红洲

梁立明

张琪玉

赖茂生

陈光祚

曾民族

侯汉清

焦玉英

王崇德

359.00

229.00

72.00

20.00

7.00

6.00

7.00

6.00

5.00

3.00

3.00

1.00

邱均平

229.00

418.00

112.00

17.00

9.00

24.00

1.00

6.00

10.00

7.00

1.00

2.00

罗式胜

72.00

112.00

227.00

15.00

2.00

10.00

2.00

9.00

2.00

2.00

1.00

0.00

蒋国华

20.00

17.00

15.00

108.00

26.00

30.00

0.00

1.00

0.00

0.00

0.00

0.00

赵红洲

7.00

9.00

2.00

26.00

49.00

3.00

1.00

0.00

1.00

0.00

0.00

0.00

梁立明

6.00

24.00

10.00

30.00

3.00

73.00

0.00

0.00

0.00

0.00

0.00

0.00

张琪玉

7.00

1.00

2.00

0.00

1.00

0.00

256.00

30.00

40.00

9.00

147.00

19.00

赖茂生

6.00

6.00

9.00

0.00

0.00

0.00

30.00

126.00

31.00

17.00

17.00

9.00

陈光祚

5.00

10.00

2.00

0.00

1.00

0.00

40.00

31.00

147.00

27.00

14.00

17.00

曾民族

3.00

7.00

2.00

0.00

0.00

0.00

9.00

17.00

27.00

73.00

3.00

5.00

侯汉清

3.00

1.00

1.00

0.00

0.00

0.00

147.00

17.00

14.00

3.00

193.00

7.00

焦玉英

1.00

2.00

0.00

0.00

0.00

0.00

19.00

9.00

17.00

5.00

7.00

60.00

总计

359.00

418.00

227.00

108.00

49.00

73.00

256.00

126.00 147.00 73.00 193.00 60.00

 

 

聚类分析    
SPSS      
classify    
Hierarchical cluster  
method: count chi-square furthest
plot: dendrogram  

 

结果如下:

 

 

根据聚类分析结果 标志每个对象的组别,见下图的最右边一列。

 

    王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 聚类分组
1 王崇德 359.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 1.00 D
2 邱均平 229.00 418.00 112.00 17.00 9.00 24.00 1.00 6.00 10.00 7.00 1.00 2.00 D
3 罗式胜 72.00 112.00 227.00 15.00 2.00 10.00 2.00 9.00 2.00 2.00 1.00 0.00 D
4 蒋国华 20.00 17.00 15.00 108.00 26.00 30.00 0.00 1.00 0.00 0.00 0.00 0.00 C
5 赵红洲 7.00 9.00 2.00 26.00 49.00 3.00 1.00 0.00 1.00 0.00 0.00 0.00 C
6 梁立明 6.00 24.00 10.00 30.00 3.00 73.00 0.00 0.00 0.00 0.00 0.00 0.00 C
7 张琪玉 7.00 1.00 2.00 0.00 1.00 0.00 256.00 30.00 40.00 9.00 147.00 19.00 A
8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 126.00 31.00 17.00 17.00 9.00 B
9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 31.00 147.00 27.00 14.00 17.00 B
10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 17.00 27.00 73.00 3.00 5.00 B
11 侯汉清 3.00 1.00 1.00 0.00 0.00 0.00 147.00 17.00 14.00 3.00 193.00 7.00 A
12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 9.00 17.00 5.00 7.00 60.00 B

 

在excel中,按照聚类分组排序各行,如下图:

    王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 聚类分组
7 张琪玉 7.00 1.00 2.00 0.00 1.00 0.00 256.00 30.00 40.00 9.00 147.00 19.00 A
11 侯汉清 3.00 1.00 1.00 0.00 0.00 0.00 147.00 17.00 14.00 3.00 193.00 7.00 A
8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 126.00 31.00 17.00 17.00 9.00 B
9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 31.00 147.00 27.00 14.00 17.00 B
10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 17.00 27.00 73.00 3.00 5.00 B
12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 9.00 17.00 5.00 7.00 60.00 B
4 蒋国华 20.00 17.00 15.00 108.00 26.00 30.00 0.00 1.00 0.00 0.00 0.00 0.00 C
5 赵红洲 7.00 9.00 2.00 26.00 49.00 3.00 1.00 0.00 1.00 0.00 0.00 0.00 C
6 梁立明 6.00 24.00 10.00 30.00 3.00 73.00 0.00 0.00 0.00 0.00 0.00 0.00 C
1 王崇德 359.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 1.00 D
2 邱均平 229.00 418.00 112.00 17.00 9.00 24.00 1.00 6.00 10.00 7.00 1.00 2.00 D
3 罗式胜 72.00 112.00 227.00 15.00 2.00 10.00 2.00 9.00 2.00 2.00 1.00 0.00 D

 

如果计算B组的密度,则只保留同组的(赖茂生,陈光祚,曾民族),删除其他各列:

    赖茂生 陈光祚 曾民族 焦玉英

合计:

8 赖茂生 0.00 31.00 17.00 9.00 57.00
9 陈光祚 31.00 0.00 27.00 17.00 75.00
10 曾民族 17.00 27.00 0.00 5.00 49.00
12 焦玉英 9.00 17.00 5.00 0.00 31.00

 

把对角线的数字替换为0,求每一行的和(上图中的最右一列)。然后求这些和的均值,此处为53.

 

    王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 侯汉清 合计
8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 17.00 68.00
9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 14.00 72.00
10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 3.00 24.00
12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 7.00 29.00
                  均值 48.25

 

如果求B组的向心度,则删除同组的列,然后求每一行的和,这些和的均值就是B组的向心度,此处是48.25。

如此,求出每一组的向心度和密度……,求各组的向心度和密度的均值,以此作为坐标的原点

 

  A B C D 均值M(坐标的原点)
密度   53      
向心度   48.25      

 

 具体坐标值: 

  A的坐标 B的坐标 C的坐标 D的坐标
密度 A-密度均值 B-密度均值  
向心度 A-向心度均值 B-向心度均值  

最后的结果是这样的:

 

 战略坐标用于共词分析,这里的数据则是同被引的数据,所以其对战略坐标的解释还需要慎重。下面的解释权当做戏说:

密度最高的是王崇德和邱均平,文献计量学,内部联系密切;但是向心度低,与其他研究题目不密切,或者不是中心性的课题,

向心度最高的是张琪玉和侯汉清,检索语言,很多学科都和他们有联系,但是从密度上看,研究课题的内部不是很密切,但是也高于其余两组。

蒋国华等人的研究题目内部联系也不是很密切,同时与其他研究题目关系也不密切;赖茂生等人的研究课题更接近中心一点,即与其他研究关系比较密切,同时,自身的密度也稍微高于蒋国华等人的研究领域。

切记,对应的是这些研究者的研究主题,而不是研究者本人。

 

 





https://blog.sciencenet.cn/blog-82196-312367.html

上一篇:关于共现分析实际操作的通信
下一篇:寄语学术界的富二代们
收藏 IP: .*| 热度|

3 魏瑞斌 武夷山 章成志

发表评论 评论 (1 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 15:23

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部