在路上.......分享 http://blog.sciencenet.cn/u/longxie1983 一念嗔心起,百万障门开

博文

ICML'11论文阅读:Cauchy Graph Embedding

已有 10585 次阅读 2011-6-8 21:45 |个人分类:书摘|系统分类:科研笔记| 机器学习, 数据挖掘, Graph, icml, 降维

ICML 2011的paper list终于出来了,虽然不是一个领域小领域,但是有些文章还是挺有趣。对看过的文章简单的记录一下,用DBer的角度给出理解。

ML 中的Embedding,简单说就是降维,想把数据点根据他们之间的关系投影到低维空间。

之所以题目中有Graph,那是因为需要降维的数据点是用Graph的结构进行组织的。

好了,给定一组n个数据点,根据特定的评价函数,可以知道任意两个数据点间的相似性。如果这n个数据点构成一个有权完全图,那么前面计算得到的相似性值就是边上的权重。

现在的问题就变成了,我想对数据进行聚类等处理,但是太复杂不好办,我需要降维,降维的要求是

其中wij表示数据点i和数据点j之间的边的权重,也就是他们的相似度,而xi表示数据点i投影后的点。

这个条件说白了就是,如果点i,j的相似度大于点p,q的相似度,那么投影后xi,xj 间的距离就要更近。

论文作者指出,之前一直使用的Laplacian embedding在很多应用中无法满足上面的要求,因此自己提出了一个新的embedding方法。

具体的技术细节就不介绍了,上两张原论文的图看看Laplacian embedding和Cauchy embedding后数据的差异吧。




https://blog.sciencenet.cn/blog-483379-453063.html

上一篇:新加坡空军开放日-RSFA Open House’11
下一篇:中国审稿人怎么了?竟然把评审的稿件拒了后,换上自己的名字重投
收藏 IP: 202.161.43.*| 热度|

1 江俊君

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-11-23 19:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部