我爱读PAMI分享 http://blog.sciencenet.cn/u/jingyanwang

博文

[回顾]哪些样本最离谱?:Class Conditional Nearest Neighbor

已有 2910 次阅读 2010-5-31 12:04 |个人分类:REVW|系统分类:论文交流

Class Conditional Nearest Neighbor for Large Margin Instance Selection 

Marchiori, E.;
Pattern Analysis and Machine Intelligence, IEEE Transactions on
Volume: 32 , Issue: 2
Digital Object Identifier: 10.1109/TPAMI.2009.164 
Publication Year: 2010 , Page(s): 364 - 370

IEEE Journals  

=====================回顾====================:

其实,这篇文章的最核心的思想在于:将类别信息引入最近邻搜索,提出了同类和异类的最近邻,然后有两个图来描述这两中关系。

插话:其实这个思想已经不新鲜,已经有人做过,将类别信息引入最近邻搜索,并提出了一种判别分析的方法。 

Graph Embedding and Extensions: A General Framework for Dimensionality Reduction

Shuicheng Yan; Dong Xu; Benyu Zhang; Hong-Jiang Zhang; Qiang Yang; Lin, S.;
Pattern Analysis and Machine Intelligence, IEEE Transactions on
Volume: 29 , Issue: 1
Digital Object Identifier: 10.1109/TPAMI.2007.250598 
Publication Year: 2007 , Page(s): 40 - 51

IEEE Journals

1.Class Conditional selection phase

图里面的节点,每一个箭头指过来(入度),说明另个样本把自己作为同类(异类)最近样本了。

很显然,做别人同类最近样本是好事而做别人的异类最近样本,说明你不太靠谱,有点叛逆投敌的嫌疑。

根据这样的规则,提出了一种样本评判的得分:



有了这个分数,就有了对样本进行筛选的算法CC:

2.Thin-Out Instance Selection: THIN

还有一点,我们之前没介绍的:除了把那些不靠谱的踢掉,那些靠谱的人中间,也很很多是平庸的,也可以踢掉,只留下那些在边境上的精英们:Thin-Out Instance Selection: THIN



其实,这篇文章的启示还有:

  1. 一些思想,也可以用在样本选择上,样本选择也是一个应用的领域;

  2. 再一次,别忘记了,用这些得分对检索的样本重新排序。



https://blog.sciencenet.cn/blog-205121-330564.html

上一篇:像样条那样入党:Local Spline Regression
下一篇:又好又快的检索:Fast Similarity Search
收藏 IP: 109.171.129.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-25 16:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部