ICML'11论文阅读:Cauchy Graph Embedding
已有 10585 次阅读
2011-6-8 21:45
|个人分类:书摘|系统分类:科研笔记|
机器学习, 数据挖掘, Graph, icml, 降维
ICML 2011的paper list终于出来了,虽然不是一个领域小领域,但是有些文章还是挺有趣。对看过的文章简单的记录一下,用DBer的角度给出理解。
ML 中的Embedding,简单说就是降维,想把数据点根据他们之间的关系投影到低维空间。
之所以题目中有Graph,那是因为需要降维的数据点是用Graph的结构进行组织的。
好了,给定一组n个数据点,根据特定的评价函数,可以知道任意两个数据点间的相似性。如果这n个数据点构成一个有权完全图,那么前面计算得到的相似性值就是边上的权重。
现在的问题就变成了,我想对数据进行聚类等处理,但是太复杂不好办,我需要降维,降维的要求是
其中w
ij表示数据点i和数据点j之间的边的权重,也就是他们的相似度,而x
i表示数据点i投影后的点。
这个条件说白了就是,如果点i,j的相似度大于点p,q的相似度,那么投影后x
i,x
j 间的距离就要更近。
论文作者指出,之前一直使用的Laplacian embedding在很多应用中无法满足上面的要求,因此自己提出了一个新的embedding方法。
具体的技术细节就不介绍了,上两张原论文的图看看Laplacian embedding和Cauchy embedding后数据的差异吧。
https://blog.sciencenet.cn/blog-483379-453063.html
上一篇:
新加坡空军开放日-RSFA Open House’11下一篇:
中国审稿人怎么了?竟然把评审的稿件拒了后,换上自己的名字重投