大家好,下面我将简单地介绍下我的研究方向——图像分割。我想把它做成一个系列,在自己学习的同时与大家分享自己的经验。要是看到文章对自己有帮助的,也请留个言,给我些写后续分割相关文章的动力。之后也很可能展示一下自己的实验。
(一)图像分割介绍
图像分割在我看来是一个非常基础的工作,它属于计算机视觉中的中层视觉任务。这是因为它是一个利用底层的信息(如颜色,纹理、边界以及对比度等等,)来建立模型,又作为很多其他应用的输入(视频监控、人体部件解析、人体属性分类等)。
大家平时在使用一些软件时,都会显式或者隐式地用到分割这个工具。比如在我们想从一张自己拍的照片里PS出想要的一个物品。用过PS的人会有这样子的体验:当自己把鼠标移动到想要的区域时,它会自动的分出物体区域,然后你通过调解尺度来做到很精细的抠图。在我看来,这样子的一个过程中需要考虑的有一下几点:
1.当用户在图像上交互后,怎么快速地将物体(或部分物体)分出来。
2.如何做到分割出来的物体的完整性。
3.用户交互方式的友好性。
现在,我们这里先来关注一下一些经典文献中使用的用户交互方式。
1.前背景用户画线
这个方式说白了就是,输入一个待分割的图像(里面包含一个感兴趣的物体),我们在它的物体部分画线,并且在不需要的背景部分画线,最后希望来获得前景物体的完整分割结果。
2.感兴趣物体外接矩形框
这个交互方式中有一个经典的方法是GrabCut(网上有代码)。他通过给感兴趣的物体画一个矩形框来将它分割出来,要是物体的表观(Appearance)不是很复杂,它能很快速地将物体分割出来,并且具有很好的完整性。当然,一次交互获得的结果往往不能让人很满意,后端作者加入了上面提到的前背景交互线(scrribles),来完善结果。
总的来说,现在出现的一些一般性物体的分割方法都是在此基础上的一些变形,只是用了不同的约束条件。比如说,要求用户输入一个包含物体的紧致的矩形框;假设分割出来的物体是尽量充满矩形框的;前后背景不一致性很大,等等。
所以说,现有最好的一般物体分割方法,在只能停留在数据集上(存在很大的表观变化,但一般分辨率很高),真正用于自然图像或者复杂条件下(光照、遮挡、低分辨率等)时,现存方法的泛化能力还是很有限的。
希望大家通过我的介绍对这个图像分割有一定的了解。
(to be continued...)
https://blog.sciencenet.cn/blog-733228-577357.html
上一篇:
一个很简单的汉语自动分词系统下一篇:
计算机视觉...