|
样本与特征共同影响着目标检测模型的性能,充足的样本可让目标检测模型学习到丰富的特征空间信息,具有强表征性的特征又可大幅提升目标检测模型的精准性和鲁棒性。图像卷积操作为表征特征空间之一的良好策略,但常规卷积矩形采样方式存在一定的局限性,且目标样本不均衡、目标不显著或难区分等导致相关目标检测算法的检测精度较低。
开放科学(资源服务)标识码(OSID)
立足实际的生态蝴蝶监测任务来研究目标检测算法,并且生态蝴蝶种类的及时识别与鉴定在农林业生产与保护、艺术生活等方面均具有重要意义。蝴蝶丰富多样的形态与色彩形成了极其丰富的蝴蝶种类,《世界蝴蝶分类名录》记录了世界蝴蝶17 科、47 亚科、1 690 属、15 141 种,其中记载中国蝴蝶12 科、33 亚科、434 属、2153 种。基于视觉技术的生态蝴蝶目标检测相关算法,目前仍存检测困难的问题,主要影响因素有:
1)生态蝴蝶种类繁多,且采集的生态照片数据分辨率迥异7630~450不等;
2)在生态照中,蝴蝶目标色彩丰富,形态多样,尺度大小多变;
3)生态照采集的背景复杂,部分蝴蝶因保护色导致目标显著度较差;
4)部分蝴蝶种类间相似度高辨识难,如云豹蛱蝶与伊诺小豹蛱蝶。
图1 生态蝴蝶照片示例
针对自然生态蝴蝶多种特征检测的实际需求,以及生态环境下蝴蝶检测效率低、精度差问题,本文提出了一种基于迁移学习和可变形卷积深度神经网络的蝴蝶检测算法(Transfer learning and deformable convolution deep learning network, TDDNET),其模型架构如图2所示。
图2 生态蝴蝶照片示例
所提算法可对蝴蝶自然生态照中不同种名的94类蝴蝶实现较高精度检测,检测结果如图3所示,数据来源:第三届中国数据挖掘大赛国际首次蝴蝶识别大赛。针对上述问题所提算法TDDNET的主要思路出发点:①利用可变形卷积提取特征空间强表征信息:因常规卷积矩形采样的局限性,导致常规卷积网络在构建模型变换时被限制于固定的几何结构,造成卷积层提取的特征表征能力较弱,在池化过程也只能在固定的比例下降低特征空间分辨率。因可变形卷积模型引入了空间几何形变的学习能力, 结合双线性差值让卷积采样更灵活自由,从而更好地适应空间形变的目标以及特征提取任务。②利用迁移学习抑制由样本不均衡造成的负影响:因部分目标特征表征相似,即目标特征空间距离较近,利用迁移学习来共享同构特征空间,以弥补目标样本不足造成的特征表征匮乏,并由微调策略学习差异特征空间,来区分不同蝴蝶目标类别,以提升检测模型的性能。
图3 生态蝴蝶检测结果可视化示例
所提蝴蝶检测算法TDDNET实体化软件界面与操作流程如动态图4所示,软件运行环境的基础配置Windows10+cuda9.0。
图4 TDDNET生态蝴蝶检测软件Demo展示
引用格式:李策, 张栋, 杜少毅, 朱子重, 贾盛泽, 曲延云. 一种迁移学习和可变形卷积深度学习的蝴蝶检测算法. 自动化学报, 2019, 45(9): 1772-1782.
链接:http://html.rhhz.net/ZDHXBZWB/html/2019-9-1772.htm
作者简介
李策,工学博士,兰州理工大学电气工程与信息工程学院教授。主要研究方向为计算视觉与模式识别,智能机器人,图像处理及应用。本文通信作者。
E-mail: xjtulice@gmail.com
张栋,兰州理工大学硕士研究生。主要研究方向为计算机视觉与图像处理。
E-mail: dongzhangcv@qq.com
杜少毅,工学博士,西安交通大学人工智能与机器人研究所教授。主要研究方向为计算机视觉, 机器学习和模式识别。
E-mail: dushaoyi@mail.xjtu.edu.cn
朱子重,兰州理工大学学院硕士研究生。主要研究方向为计算机视觉与图像处理。
E-mail: zizhongzhu_cv@163.com
贾盛泽,兰州理工大学学院硕士研究生。主要研究方向为计算机视觉与图像处理。
E-mail: jiasz0607@163.com
曲延云,工学博士, 厦门大学信息科学与技术学院计算机科学系教授。主要研究方向为模式识别, 计算机视觉和机器学习。
E-mail: yyqu@xmu.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-21 07:01
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社