谱聚类的运行结果的好坏直接和数据的相似度矩阵相关。一般情况下,我们都是假定相似度矩阵是已知的,因此他的许多应用得以实行。但是,实际上数据的相似度是不易获得的,本文的目标在于限定约束的查询数量的同时保证算法的运行效率。
之前,fast sc算法和使用Nystrom的方法得到了广泛的应用。fast sc一般都是先获得数据的一种划分,他的缺点也是要提前知道数据的相似度矩阵;使用Nystrom的方法虽然是使用抽样的方法、利用低秩矩阵逼近获得相似度矩阵,但是需要对矩阵的秩进行假设。
https://blog.sciencenet.cn/blog-795564-671016.html
上一篇:
NMF on Kernels下一篇:
multi-view clustering of multilingual documents