swb0802的个人博客分享 http://blog.sciencenet.cn/u/swb0802

博文

《数据挖掘导论》读书笔记(一)

已有 3253 次阅读 2012-12-14 10:30 |系统分类:科研笔记| 读书笔记, 聚类, 数据挖掘挖掘

聚类分析
聚类类型:
层次&划分
层次聚类的结果有overlapping,簇集合是嵌套的。而划分的聚类类似于等价类划分,数据划分不重叠   
互斥、重叠与模糊的
互斥的是指数据点只属于一个簇。重叠的是数据点可能属于多个簇。模糊的指数据点以一定的权重属于任意簇
完全与部分的
完全聚类是指最终所有数据点都被指派到某个簇中。而部分的是指只有一部分数据点被指派到簇,其他数据点不关心
簇类型:
明显分离的
基于原型的(如K-means)
每个对象到定义该簇的原型的距离比到其他簇的原型距离更近(或更加相似)
基于图的
如果数据用图表示,其中结点是对象,而边代表对象之间的联系,则簇可以定义为连通分支,级互相联通但不与组外对象连通的对象组。
基于密度的(如DBSCAN)
簇是对象的稠密区域,被低密度区域环绕
共同性质的



https://blog.sciencenet.cn/blog-795423-642520.html

上一篇:Reading list 1(不断更新)
下一篇:《数据挖掘导论》读书笔记(二)
收藏 IP: 210.30.97.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-7-17 22:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部