博文

k-mediod算法

已有 3948 次阅读 2017-11-21 17:01 |系统分类:科研笔记

看了很多关于k-mediod算法的资料，这个应该是比较准确的。

K-MEANS算法的缺点：

产生类的大小相差不会很大，对于脏数据很敏感。

改进的算法：K-medoids方法。

这儿选取一个对象叫做mediod来代替上面的中心的作用，这样的一个medoid就标识了这个类。

K-MEDODIS的具体流程如下：

1）任意选取K个对象作为medoids（O1,O2,…Oi…Ok）。　　

2）将余下的对象分到各个类中去（根据与medoid最相近的原则）；　　

3）对于每个类（Oi）中，顺序选取一个Or，计算用Or代替Oi后的消耗—E（Or）。选择E最小的那个Or来代替Oi。这样K个medoids就改变了。

4）重复2、3步直到K个medoids固定下来。　　

不容易受到那些由于误差之类的原因产生的脏数据的影响，但计算量显然要比K-means要大，一般只适合小数据量。

转载本文请联系原作者获取授权，同时请注明本文来自王硕朋科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3347678-1086216.html

上一篇：第一篇EI检索PAPER
下一篇：第一篇SCI论文被拒

收藏 IP: 219.150.53.*| 热度|

数据加载中...

返回顶部

扫一扫，分享此博文