莫问收获,但务耕耘分享 http://blog.sciencenet.cn/u/xiezilai 中国科学技术信息研究所

博文

SPSS中的聚类分析

已有 10558 次阅读 2010-9-25 14:45 |个人分类:SPSS学习|系统分类:科研笔记|关键词:SPSS,聚类| SPSS, 聚类

题外话:聚类理论都比我懂,在这只能做做笔记
 
1.       TwoStep Cluster Analysis
刚接触它时莫名其妙,不明白为什么会有这一项。粗略了解后,感觉其主要特点一是可计算出最佳聚类个数,二是可处理分类变量(Categorical Variables)与连续性变量(Continuous Variables)。计算步骤包括:1)构建聚类特征数(Cluster Features Tree);2)层次聚类。自动确定最佳聚类个数的方法是Schwarz’s Bayesian Criterion(BIC)或Akaike’s Information Criterion(AIC)。这俩准则是啥,知道的朋友记得告诉我。
在结果输出的“Auto-Clustering”表中(以BIC为例),第2列是BIC,其值最小时,一般认为聚类结果最理想;第3列是BIC变化,反映合并前后两种聚类结果的BIC变化情况,绝对值越大,聚类结果越理想;第4列是BIC变化率,同样反映合并前后的变化;第5列是最小距离变化率,一般认为值越大越理想。需要说明的是,虽然有4个统计指标,但不是根据某一个指标来确定聚类个数,而是综合考虑的结果。
2.数据标准化
       Hierarchical Cluster和TwoStep Cluster都能在分析中对数据进行标准化处理,K-Means Cluster则必须事先完成。
3.方差分析表
       ANOVA表中的Sig.小于0.05,表明该指标在各类间存在显著性差异。指标的F值越大,表明该指标在聚类分析中越重要。 


http://blog.sciencenet.cn/blog-422720-366766.html

上一篇:SPSS中的参数检验(二)
下一篇:图情档SCI/SSCI期刊(2010)

6 高建国 宋敦江 陈筝 化柏林 丁甜 田灿荣

发表评论 评论 (1 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备14006957 )

GMT+8, 2020-1-20 11:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部