||
Class Conditional Nearest Neighbor for Large Margin Instance Selection
Marchiori, E.;
Pattern Analysis and Machine Intelligence, IEEE Transactions on
Volume: 32 , Issue: 2
Digital Object Identifier: 10.1109/TPAMI.2009.164
Publication Year: 2010 , Page(s): 364 - 370
IEEE Journals
Abstract | Full Text: PDF (1703 KB)
方法:
讲的是如何从训练集中选择“好”的样本,使得最紧邻分类器的分类率最大。
具体地,定义了两个图,来描述样本的最紧邻的关系;然后从每个样本的如度定义一个分数,分数越低,说明这个样本越“离谱”;最后,根据分数排序,用一个迭代的算法,把能最大化Margin的样本选择出来。
这只是考虑了分类性能,还有很多样本对分类起不了多少作用的,再根据上面的两个图来筛选掉。
启示:
1.样本选择是个不错的方法,原文是为了NN而选择,我可以为了KNN选择
2.作者提出的建立图的方法,进行打分,倒是非常意思。作者也说了,可以根据这种打分来做特征选择和学习距离。这样的话,只要能最大化一个基于此分数的标准就可以了。
3.根据这种得分,对检索得到的样本进行排序,把“不靠谱”的排在后面,可以提高检索的准确率。
作者是一个荷兰女学者,名叫Elena Marchiori,主页是:http://www.cs.ru.nl/~elenam/
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-22 04:13
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社