IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

深度学习在目标视觉检测中的应用进展与展望

已有 6166 次阅读 2017-12-4 17:16 |系统分类:博客资讯

目标视觉检测是计算机视觉领域中一个非常重要的研究问题。随着电子设备的应用在社会生产和人们生活中越来越普遍,数字图像已经成为不可缺少的信息媒介,每时每刻都在产生海量的图像数据。与此同时,对图像中的目标进行精确识别变得越来越重要。我们不仅关注对图像的简单分类,而且希望能够准确获得图像中存在的感兴趣目标及其位置,并将这些信息应用到视频监控、自主驾驶、人机交互等一系列现实任务中,因此目标视觉检测技术受到了广泛关注。

传统的目标视觉检测技术在流程上大致分为三个步骤: 区域建议(Regionproposal)、特征表示(Feature representation)和区域分类(Region classification),如图1所示。该基本流程被许多工作所采用,它们在目标区域建议、图像特征表示、候选区域分类上分别采用了不同的处理策略。近年来,随着深度学习技术的发展,很多基于深度学习的目标视觉检测算法陆续被提出,在精度上显著优于传统方法,成为最新的研究热点。


图1 目标视觉检测的基本流程

深度学习模型具有强大的表征和建模能力,通过监督或非监督的训练方式,能够逐层、自动地学习目标的特征表示,实现对物体层次化的抽象和描述。在图像识别领域中,Krizhevsky等于2012年构建深度卷积神经网络(CNN),在大规模图像分类任务上取得了巨大成功,引起了对CNN模型的高度重视,也因此推动了目标检测的研究进展。本文首先介绍了图像分类中经典的AlexNet及其改进模型ZFNet、VGG、GoogLeNet、ResNet等。随着模型变得越来越深,图像分类的Top-5错误率也越来越低,目前已经降低到3%以下。与图像分类一样,目标检测的输入也是整幅图像,它们在特征表示、分类器设计上具有很大的相通性。通过采用这些CNN模型得到更强大的特征表示,然后应用到目标检测任务,可以获得更高的检测精度。本文从基于区域建议的方法和无区域建议的方法两个方面来介绍深度学习在目标视觉检测中的研究现状,并汇总了公开的实验结果进行定量比较。

最后讨论了深度学习方法应用于目标视觉检测时存在的困难和挑战,例如深度学习理论还不完善、大规模多样性数据集还很缺乏。为了解决这些问题,我们认为可以采用平行视觉的思路来进行研究。2016年,王坤峰等将复杂系统建模与调控的ACP理论推广到视觉计算领域,提出平行视觉的基本框架和关键技术,如图2所示。通过“人工场景”提供大规模多样性的标记数据集,通过“计算实验”全面设计和评价目标视觉检测方法,通过“平行执行”在线优化视觉系统,能够激发深度学习的潜力。我们相信,深度学习与平行视觉相结合,必将大力推动目标视觉检测的研究和应用进展。


图2 平行视觉的基本框架

引用格式:张慧, 王坤峰, 王飞跃. 深度学习在目标视觉检测中的应用进展与展望. 自动化学报, 2017, 43(8): 1289-1305

链接:http://html.rhhz.net/ZDHXBZWB/html/2017-8-1289.htm

作者简介:

张慧中国科学院自动化研究所复杂系统管理与控制国家重点实验室博士研究生。主要研究方向为智能交通系统,目标视觉检测,深度学习。E-mail: zhanghui2015@ia.ac.cn


王坤峰中国科学院自动化研究所复杂系统管理与控制国家重点实验室副研究员。主要研究方向为智能交通系统,智能视觉计算,机器学习。E-mail: kunfeng.wang@ia.ac.cn


王飞跃中国科学院自动化研究所复杂系统管理与控制国家重点实验室研究员。国防科技大学军事计算实验与平行系统技术研究中心主任。主要研究方向为智能系统和复杂系统的建模、分析与控制。本文通信作者。E-mail: feiyue.wang@ia.ac.cn




https://blog.sciencenet.cn/blog-3291369-1088197.html

上一篇:第二期自动化前沿热点论坛:2017年智能机器人与无人系统论坛
下一篇:北工大乔俊飞教授等|基于自适应学习率的深度信念网设计与应用
收藏 IP: 159.226.19.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 10:43

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部