qianli8848的个人博客分享 http://blog.sciencenet.cn/u/qianli8848

博文

Locality-constrained Linear Coding for Image Classification

已有 8146 次阅读 2012-5-9 18:14 |个人分类:论文分析|系统分类:论文交流

Locality-constrained Linear Coding for Image Classification分析及其纠错 

前段时间看了这篇CVPR 2010的文章,感觉不错,而且还有代码,可以从UIUC的Jianchao Yang主页上下载~
这篇文章的创新点是编码方式的创新,提出了LLC

这篇文章是在Linear Spatial Pyramid Matching using Sparse Coding for Image Classification基础上的改进。
稀疏表示的目标式为:Locality-constrained <wbr>Linear <wbr>Coding <wbr>for <wbr>Image <wbr>Classification分析及其纠错
而在LLC当中把后面的正则项的一范数改为二范数:Locality-constrained <wbr>Linear <wbr>Coding <wbr>for <wbr>Image <wbr>Classification分析及其纠错
di代表的重构的特征xi和每个码字(code)的距离,上面式子的物理意义是特征离码字的距离越远重构的系数越小,极端情况就是用他近邻的码本来重构他。而且这个式子有解析解。
LLC有以下三个性质:
1.跟原始的向量量化比较用多个码字重构能够有更小的重构误差
2.能达到局部平滑稀疏性
3.跟sparse比较能够有解析解,文中提到的解析解为:
Locality-constrained <wbr>Linear <wbr>Coding <wbr>for <wbr>Image <wbr>Classification分析及其纠错

不过我自行推导了一下,文章中的解是存在问题的。以下解应该是正确的:
Locality-constrained <wbr>Linear <wbr>Coding <wbr>for <wbr>Image <wbr>Classification分析及其纠错
估计应该是作者的笔误,瑕不掩瑜嘛~
最后他为了快速计算LLC是选择最近邻的5个点重构他的,码本的训练也可以用k-means直接聚类,跟他提出的codebook optimization的结果差不多的。


作者在具体实现的时候有一个小的细节,他为了矩阵求逆的方便在要求矩阵的对角线加上一些比较小的数,这种方法叫做regularlization,也叫脊回归。

最后文章的效果还是不错的,在caltech-101,caltech-256还有pascal voc2007数据集上都做了验证~


https://blog.sciencenet.cn/blog-722391-568956.html

上一篇:新人来报个道
下一篇:2011BMVC best poster:an evaluation of recent feature encodin
收藏 IP: 159.226.20.*| 热度|

0

发表评论 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-9-27 08:40

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部