博文

目标检测模型及其优化方法综述

已有 2657 次阅读 2022-8-22 17:14 |系统分类:博客资讯

引用本文

蒋弘毅, 王永娟, 康锦煜. 目标检测模型及其优化方法综述. 自动化学报, 2021, 47(6): 1232−1255 doi: 10.16383/j.aas.c190756

Jiang Hong-Yi, Wang Yong-Juan, Kang Jin-Yu. A survey of object detection models and its optimization methods. Acta Automatica Sinica, 2021, 47(6): 1232−1255 doi: 10.16383/j.aas.c190756

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190756

关键词

卷积神经网络，目标检测，子模块优化

摘要

近年来, 基于卷积神经网络的目标检测研究发展十分迅速, 各种检测模型的改进方法层出不穷. 本文主要对近几年内目标检测领域中一些具有借鉴价值的研究工作进行了整理归纳. 首先, 对基于卷积神经网络的主要目标检测框架进行了梳理和对比. 其次, 对目标检测框架中主干网络、颈部连接层、锚点等子模块的设计优化方法进行归纳, 给出了各个模块设计优化的基本原则和思路. 接着, 在COCO数据集上对各类目标检测模型进行测试对比, 并根据测试结果分析总结了不同子模块对模型检测性能的影响. 最后, 对目标检测领域未来的研究方向进行了展望.

文章导读

目标检测是指利用计算机工具和相关算法来对现实世界中的对象进行分类和定位的一类计算机视觉技术.

传统的目标检测需要手工提取特征[1-3], 并针对特定检测对象设计和训练分类器. 这类方法难以获得鲁棒性强的特征, 对外界环境噪声十分敏感, 故在工程应用上具有较大的局限性.

现阶段, 随着深度学习技术的不断发展和硬件设施的不断进步, 基于卷积神经网络的目标检测技术发展迅速. 以区域卷积神经网络[4-6] (Region convolutinal neural network, R-CNN)系列为代表的两阶段法, 与以单阶段检测器[7] (Single-shot detector, SSD)和YOLO[8-10] (You only look once)系列为代表的单阶段法是当前基于卷积神经网络的目标检测技术的两种主流框架.

近年来, 不少学者在两种框架的基础上对内部的主干网络、锚点设计、区域特征编码等子模块进行了优化改进, 有效地提高了目标检测算法的性能. 部分学者还提出了一种基于对象关键点的目标检测框架[11-14], 并在各大数据集上取得了惊人的成绩.

本文针对近年来目标检测算法的最新研究进展, 从目标检测框架的子模块设计优化角度出发, 对该领域中一些有启发性的研究成果进行整理、归纳和分析, 并对目标检测模型的优化思路提出一些建议, 以便众多相关研究者参考和借鉴.

图 1 主流的目标检测框架

图 2 CornerNet框架流程

图 3 典型目标检测算法速度−准确率对比

本文归纳分析了目标检测模型的子模块优化方法, 并对目标检测领域未来发展的方向进行了展望, 从中得出了以下结论:

1) 不同的检测场景与任务对模型性能的要求不同, 应根据具体场景与任务特点对模型做相应的改进, 并在专业数据集上对其进行训练与测试.

2) 主干网络和颈部连接层的结构优化能够抽取更好的目标特征, 因而几乎在任何场景、对任何模型的检测性能提升都是非常有利的.

3) 当检测场景中目标分布密集, 相互遮挡问题严重时, 非极大值抑制算法和交并比算法的优化能够有效缓解目标漏检的问题, 从而提升模型对密集目标的检测性能.

4) 当检测场景相对复杂, 背景嘈杂时, 正负样本采样算法和损失函数设计的优化能提升模型从各类训练样本中学习的效果, 进而提高模型对困难目标的检测效果.

5) 目标检测领域在未来将围绕更优的检测性能与更好的工程落地两个不同方向, 从自动化、轻量化、域适应、少样本、弱监督等角度展开进一步深入研究.

作者简介

蒋弘毅

南京理工大学机械工程学院硕士研究生. 主要研究方向为图像处理与目标检测. E-mail: jianghongyi_1996@163.com

王永娟

南京理工大学机械工程学院教授. 主要研究方向复杂与智能机械系统设计. 本文通信作者. E-mail: 13951643935@139.com

康锦煜

南京理工大学机械工程学院硕士研究生. 主要研究方向为穿戴式智能单兵系统设计. E-mail: njust@3dgarms.com

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3291369-1352205.html

上一篇：基于并联卷积神经网络的图像去雾
下一篇：社会交通中的社会信号分析与感知

收藏 IP: 222.131.242.*| 热度|

当前推荐数：1 推荐人：杨学祥

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

欧彦

扫一扫，分享此博文

全部作者的精选博文

• 2023年度自动化领域国家自然科学基金申请与资助情况

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

目标检测模型及其优化方法综述

当前推荐数：1 推荐人：杨学祥

该博文允许注册用户评论请点击登录评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

目标检测模型及其优化方法综述

当前推荐数：1 推荐人： 杨学祥

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

当前推荐数：1 推荐人：杨学祥

该博文允许注册用户评论请点击登录评论 (0 个评论)