在(一)中我简单介绍了图像分割的一些基本概念。本次内容主要来分析一下分割问题中存在的一些挑战;我想通过这个文章,让朋友们知道怎么去分析分割中的问题;怎么样去选择一个适合自己的课题。
首先举一个简单的例子。现在有两张图像,各自包含一匹马;非常巧的是,这两匹马都是一个姿态下的,但是颜色不同;也就是说马有相同的pose,大小也相同。当给你展示第一张的时候,你也许会想到这样一个把马分割出来的假设:直接按照颜色分,因为马的颜色与周围背景的颜色不同;现在我们把这个想到的假设记为H,它的含义就是提取图像中某种颜色(R,G,B)(设置为一个定值),出来的就是我们要找的马;这时,第二张图像来了,你把这个H用到第二张上去,就不怎么work了。因为马颜色变化了。用了这么冗余的话来说这个,想表明:一些图像分割的问题,往往要将一个特定类(比如,马,船,花,衣服等)中的物体给分割出来,那么仅仅依靠于你先验获得的颜色信息往往是不够的。对于这个马,我们抓住了颜色这个信息,其实这还是建立在一个隐藏的假设上,就是背景足够简单,尺度一样,姿态一致。要是背景很复杂,我们直接根据颜色截断的结果就是很差:要么多了背景(false positive),要么少了马(false negative)。因此,背景的复杂度往往使得颜色模型性能降低。
必须要说的是,马的姿态也很有可能变化万千。最直观的想法,就是利用颜色以外的信息来分割。因为是特定类分割,我们有机会去获得一个类的形状。对于每个图像都获得一个形状就能帮助我们很好的来约束的问题;能使得我们更加合理的获得最后结果。可以看的出来,我们的问题现在才可能成为一个真正特定类的问题(因为有了这个类的形状信息)。
有了形状,你就要将对应的形状对应到一个包含特定尺度物体的图像中去,如果形状对于你的图像来说过大或者过小,都是没有意义的。所以后面要涉及的就是对齐的问题。一般处理这个对齐可以用物体检测的方法,就是在你做分割之前,先对物体进行一个检测,获得大致的区域,在用颜色,形状特征来建模。但是,这样的检测结果很会影响你分割结果。因为检测检测不是物体级别检测,很多都是只检测物体的一个部分,或者提供一个不是很紧致的矩形框。这样在对齐中有了扰动,就很用后端来弥补。
也有别的方法来处理这个问题。就是建立动态模板。这里不展开讲。它就是把这个对齐的问题放到了后端来处理,而不依赖于前端的检测。
所以说,这个特定类物体的分割,往往要考虑:颜色、形状、对齐等。要做出一个全自动分割的方法往往存在很大的挑战。
在下一篇中我会讲讲交互方法在分割中的应用。
https://blog.sciencenet.cn/blog-733228-578456.html
上一篇:
计算机视觉...