kele87921的个人博客分享 http://blog.sciencenet.cn/u/kele87921

博文

k-mediod算法

已有 2173 次阅读 2017-11-21 17:01 |系统分类:科研笔记

看了很多关于k-mediod算法的资料,这个应该是比较准确的。

K-MEANS算法的缺点:

产生类的大小相差不会很大,对于脏数据很敏感。

改进的算法:K-medoids方法。

这儿选取一个对象叫做mediod来代替上面的中心的作用,这样的一个medoid就标识了这个类。

K-MEDODIS的具体流程如下:

1)任意选取K个对象作为medoidsO1,O2,…Oi…Ok)。  

2)将余下的对象分到各个类中去(根据与medoid最相近的原则);  

3)对于每个类(Oi)中,顺序选取一个Or,计算用Or代替Oi后的消耗—EOr)。选择E最小的那个Or来代替Oi。这样Kmedoids就改变了。

4)重复23步直到Kmedoids固定下来。  

不容易受到那些由于误差之类的原因产生的脏数据的影响,但计算量显然要比K-means要大,一般只适合小数据量。





http://blog.sciencenet.cn/blog-3347678-1086216.html

上一篇:第一篇EI检索PAPER
下一篇:第一篇SCI论文被拒

1 杨正瓴

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-2-25 13:50

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部