|
Contextual Models for Object Detection Using Boosted Random Fields
Antonio Torralba, Kevin P. Murphy and William T. Freeman
研究图像的目标检测和分割问题。为了提取局部图像数据和上下文信息,本文提出BRFs(Boosted Random Filelds),即,使用Boosting来学习图结构和条件随机场的局部证据。图结构是通过在可增加的模型中聚集图的fragments。单个象素之间的联系很少,但是使用密集的图,我们可以挖掘图像大的区域的信息;密集的模型也支持有效的推断。我们指出其它物体的上下文信息,使用cascade,可以从准确性和速度方面提高检测性能。
我们长期的目标就是建立一个视觉系统,可以检测一副图像并描述有那些物体存在,分别在哪个位置。 上下文 Murphy等人使用全局的上下文来帮助目标识别(Murphy K.P. et al. (2003) Using the forest to see the trees a graphical model relating features, objects and scenes, In Adavances in Neural Info. Proc. Systems),但是没有对物体之间的关系建模;Fink和Perona(M. Fink and P. Perona. Mutual boosing for contextual influence. In Adavances in Neural Info. Proc. Systems, 2003)提取了局部依赖的信息,但是没有一个指导性的概率模型。
本文我们通过BRFs提取不同类目标之间上下文相互关系。Boosted random fields是建立在boosting和条件随机场(CRFs)的基础上的。 条件随机场是一种给定输入图像时,对标识(类别的输出)之间的关系建模的方法。CRFs的主要问题是怎要学习模型的关系(图)结构。四领域的格结构在底层的视觉中是非常成功的,但是不能获取整个区域之间和交叉的类别之间长距离的重要的依赖关系。在BRFs中,我们学习图结构时,使用boosting从连通模板(来自标注的分割模板)的字典中选择图结构,都组合在一个可增加的模型中。我们也用Boosting学习模型的局部证据的势。我们根据相似推论,基于信念传播迭代这些学习步骤。
除了识别目标(比如车,人)外,我们也对识别空间扩展的“stuff”感兴趣,比如路,建筑。传统的滑动窗口的目标识别方法对于检测“stuff”效果并不好。而我们把目标检测和图像分割一起来做。输出就是对图像粗糙的分割,有些区域标注了语义的涵义。我们不依赖于自底向上的图像分割算法,因为没有自顶向下的知道的方法是不稳定的。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-12-23 17:03
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社