博文

基于深度学习的抗年龄干扰人脸识别

已有 2162 次阅读 2022-3-14 10:30 |系统分类:博客资讯

引用本文

何星辰, 郭勇, 李奇龙, 高唱. 基于深度学习的抗年龄干扰人脸识别. 自动化学报, 2022, 48(3): 877−886 doi: 10.16383/j.aas.c190256

He Xing-Chen, Guo Yong, Li Qi-Long, Gao Chang. Age invariant face recognition based on deep learning. Acta Automatica Sinica, 2022, 48(3): 877−886 doi: 10.16383/j.aas.c190256

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190256?viewType=HTML

文章简介

关键词

人脸识别, 年龄干扰, 深度学习, 年龄估计, 卷积神经网络注意力模型

摘要

随着年龄的增长, 人脸的形状、纹理等特征会随之发生较大的改变从而造成显著的类内干扰, 这使得人脸识别的性能大大降低. 为了解决上述问题, 本文基于深度卷积神经网络将年龄估计任务和人脸识别任务相结合, 提出了一种抗年龄干扰的人脸识别新方法AD-CNN (Age decomposition convolution neural network), 首先将卷积块注意力模型(Convolutional block attention module, CBAM)嵌入到残差网络中以学习更具有代表性的面部特征, 随后利用线性回归指导年龄估计任务, 提取出年龄干扰因子, 通过多层感知机将整个面部特征与年龄干扰特征投影到同一线性可分空间, 最后从面部稳定的特征中将年龄干扰分离, 得到与年龄无关的面部特征, 并采用改进后的角度损失函数基于年龄无关的身份特征进行人脸识别任务, 从而达到抑制年龄干扰的目的. 本文在MORPH和FGNET数据集上的识别正确率分别达到了98.93%, 和90.0%, 充分证实了本文所提方法的先进性和有效性.

引言

人脸识别是一个极具挑战但又非常重要的问题, 因为其广泛的应用场景而受到越来越多的关注, 目前一些一般人脸识别方法在几个基准测试中已经取得了理想的成绩, 但由于人脸本身存在的较大的类内干扰(如表情、光照、年龄等)使得这项工作面临极大的困难. 其中年龄变化所引起的类内变化仍然是许多实际应用的主要瓶颈, 如寻找多年前的失踪人口、排查潜逃的犯罪嫌疑人、证件的注册及认证工作等. 相较于其他干扰, 年龄相关的变化取决于内因(如压力和疾病)和外因(如生活环境和生活方式), 以及随着年龄的增长, 脸部的纹理和形状也会发生显著改变, 这使得学习不变的模式变得困难. 因此, 基于相同年龄的的一般人脸识别模型在处理跨年龄识别任务时无法得到理想的结果, 2015年Chen等的研究显示在跨年龄识别任务中一般人脸识别模型的正确率会降低13 %以上. 生成模型和判别模型是现有的两种抗年龄干扰的人脸识别方法. 生成模型通过将面部合成到一个或多个年龄类别来进行建模, 然后利用人工面部表示进行识别, 随着深度学习的迅速发展, 生成模型在抗年龄干扰识别上更有前景. 然而生成模型的识别过程通常分为两步, 无法以端到端的方式优化识别性能, 并且通过生成模型生成的面部图像通常不稳定, 会引入额外的噪声到合成图相中从而对识别过程形成干扰. 因此, 对判别模型的研究成为近些年来的热点, 本文本文提出的深度模型也是属于判别模型的范畴.

判别模型旨在对人脸特征进行分离, 从剔除年龄相关特征, 提取年龄无关的身份特征的角度提高人脸识别的稳定性. Ling等使用梯度方向金字塔(Gradient orientation pyramid, GOP)作为年龄不变的特征并采用支持向量机(Support vector machine, SVM)作为面部识别的分类器. 许多判别模型在设计适当的特征和有效的匹配系统两个方面做了深入研究, 但大多数设计的特征仍包含干扰信息, 为了将特定于人的身份因素与年龄因素分开, Gong等提出了隐藏因子分析方法(Hidden factor analysis, HFA), 将人的面部图像表示为在衰老过程中稳定的身份特定成分和反映衰老效果的其他成分的组合, 表示身份的特征成分用于年龄不变的面部识别, 他们采用期望最大化(Expectation maximization, EM)算法来估计模型参数, 并进一步提出最大熵特征. Li等提出了区域模式选择(Local patterns selection, LPS)作为跨年龄人脸识别的新特征描述符. 文献[18] 提出了一种称为跨年龄参考编码(Cross age reference code, CARC)的编码框架, CARC能够使用年龄不变的参考空间对人脸图像的低级特征进行编码. 深度学习因其在原始特征中直接学习一系列非线性特征映射函数的卓越性能而受到广泛关注, 相比之下, 深度学习模型通常通过使用单个或几个具有集中特定损失函数的年龄模型来处理年龄差异. Wen等提出一种潜在因子引导卷积神经网络(Latent factor guided convolutional neural network, LF-CNN)模型来学习年龄不变的深层特征. XU等提出了一种非线性方法来分离整个特征以获得身份特征, 并提出称为耦合自动编码器网络(Coupled auto-encoder network, CAN)的神经网络模型, 它利用两个浅层神经网络桥接两个自动编码器以适应老化和衰老过程. Wang等提出正交嵌入CNN (Orthogonal embedding convolutional neural network, OE-CNN)模型以将深度面部表征分解成两个正交分量以表示年龄和身份特定特征. 本文基于深度学习提出了一种新的抗年龄干扰的人脸识别模型AD-CNN (Age decomposition convolution neural network), 如图1所示. 给出面部图像年龄标签和身份标签, AD-CNN同时实现年龄估计任务和人脸识别任务, 第1个全连接层输出包括年龄信息在内的所有面部特征, 第2个全连接层用于输出通过年龄回归任务所提取到的年龄特征, 并将其送入含有一层隐藏层的多层感知机(Multilayer perceptron, MLP)网络最终得到年龄相关因子, 通过从整个特征中减去年龄因子获得年龄不变特征. 此外, AD-CNN在基线网络中采用了空间注意力机制, 重新建模了特征提取过程中通道和空间的相互依赖关系, 增强了特征提取性能.

图 1 AD-CNN模型流程图

图 8 识别正确率与年龄估计值的变化曲线

作者简介

何星辰

成都理工大学信息科学与技术学院硕士研究生. 主要研究方向为图像处理, 计算机视觉与模式识别.

E-mail: hxc_cdut@163.com

郭勇

成都理工大学信息科学与技术学院教授. 主要研究方向为图像处理, 模式识别, 灾害预警与救援技术. 本文通信作者.

E-mail: guoy@cdut.edu.cn

李奇龙

成都理工大学信息科学与技术学院硕士研究生. 主要研究方向为计算机视觉, 自然语言处理.

E-mail: 15008294254@163.com

高唱

成都理工大学地球物理学院硕士研究生. 主要研究方向为机器学习.

E-mail: gaochang0708@163.com

相关文章

[1] 胡扬, 张东波, 段琪. 目标鲁棒识别的抗旋转HDO局部特征描述. 自动化学报, 2017, 43(4): 665-673. doi: 10.16383/j.aas.2017.c150837

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2017.c150837?viewType=HTML

[2] 王存睿, 张庆灵, 段晓东, 王元刚, 李泽东. 基于流形结构的人脸民族特征研究. 自动化学报, 2018, 44(1): 140-159. doi: 10.16383/j.aas.2018.c160585

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c160585?viewType=HTML

[3] 王玉, 申铉京, 陈海鹏. 基于改进的Fisher准则的多示例学习视频人脸识别算法. 自动化学报, 2018, 44(12): 2179-2187. doi: 10.16383/j.aas.2018.c170090

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c170090?viewType=HTML

[4] 尹明, 吴浩杨, 谢胜利, 杨其宇. 基于自注意力对抗的深度子空间聚类. 自动化学报, 2022, 48(1): 271-281. doi: 10.16383/j.aas.c200302

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200302?viewType=HTML

[5] 王功明, 乔俊飞, 关丽娜, 贾庆山. 深度信念网络研究现状与展望. 自动化学报, 2021, 47(1): 35-49. doi: 10.16383/j.aas.c190102

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190102?viewType=HTML

[6] 陈文帅, 任志刚, 吴宗泽, 付敏跃. 基于深度学习的极性电子元器件目标检测与方向识别方法. 自动化学报, 2021, 47(7): 1701-1709. doi: 10.16383/j.aas.c190037

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190037?viewType=HTML

[7] 林文瑞, 丛爽. 基于深度学习LDAMP网络的量子状态估计. 自动化学报. doi: 10.16383/j.aas.c210156

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210156?viewType=HTML

[8] 蒋方玲, 刘鹏程, 周祥东. 人脸活体检测综述. 自动化学报, 2021, 47(8): 1799-1821. doi: 10.16383/j.aas.c180829

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180829?viewType=HTML

[9] 孟琭, 孙霄宇, 赵滨, 李楠. 基于卷积神经网络的铁轨路牌识别方法. 自动化学报, 2020, 46(3): 518-530. doi: 10.16383/j.aas.c190182

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c190182?viewType=HTML

[10] 姜涛, 崔海华, 程筱胜, 田威. 基于深度学习初始位姿估计的机器人摄影测量视点规划. 自动化学报. doi: 10.16383/j.aas.c200255

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200255?viewType=HTML

[11] 刘一敏, 蒋建国, 齐美彬, 刘皓, 周华捷. 融合生成对抗网络和姿态估计的视频行人再识别方法. 自动化学报, 2020, 46(3): 576-584. doi: 10.16383/j.aas.c180054

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180054?viewType=HTML

[12] 侯建华, 张国帅, 项俊. 基于深度学习的多目标跟踪关联模型设计. 自动化学报, 2020, 46(12): 2690-2700. doi: 10.16383/j.aas.c180528

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180528?viewType=HTML

[13] 罗浩, 姜伟, 范星, 张思朋. 基于深度学习的行人重识别研究进展. 自动化学报, 2019, 45(11): 2032-2049. doi: 10.16383/j.aas.c180154

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c180154?viewType=HTML

[14] 李文英, 曹斌, 曹春水, 黄永祯. 一种基于深度学习的青铜器铭文识别方法. 自动化学报, 2018, 44(11): 2023-2030. doi: 10.16383/j.aas.2018.c180152

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2018.c180152?viewType=HTML

[15] 随婷婷, 王晓峰. 一种基于CLMF的深度卷积神经网络模型. 自动化学报, 2016, 42(6): 875-882. doi: 10.16383/j.aas.2016.c150741

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150741?viewType=HTML

[16] 金连文, 钟卓耀, 杨钊, 杨维信, 谢泽澄, 孙俊. 深度学习在手写汉字识别中的应用综述. 自动化学报, 2016, 42(8): 1125-1141. doi: 10.16383/j.aas.2016.c150725

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150725?viewType=HTML

[17] 贺昱曜, 李宝奇. 一种组合型的深度学习模型学习率策略. 自动化学报, 2016, 42(6): 953-958. doi: 10.16383/j.aas.2016.c150681

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150681?viewType=HTML

[18] 朱煜, 赵江坤, 王逸宁, 郑兵兵. 基于深度学习的人体行为识别算法综述. 自动化学报, 2016, 42(6): 848-857. doi: 10.16383/j.aas.2016.c150710

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150710?viewType=HTML

[19] 耿杰, 范剑超, 初佳兰, 王洪玉. 基于深度协同稀疏编码网络的海洋浮筏SAR图像目标识别. 自动化学报, 2016, 42(4): 593-604. doi: 10.16383/j.aas.2016.c150425

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.2016.c150425?viewType=HTML

[20] 蔺蘭, 赵戈, 唐延东, 田建东, 何思远. 基于几何模型的单幅人脸图像光照补偿方法. 自动化学报, 2013, 39(12): 2090-2099. doi: 10.3724/SP.J.1004.2013.02090

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2013.02090?viewType=HTML

[21] 王志宏, 袁姮, 姜文涛. 基于复合梯度向量的人脸识别算法. 自动化学报, 2011, 37(12): 1445-1454. doi: 10.3724/SP.J.1004.2011.01445

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2011.01445?viewType=HTML

[22] 张宇, 周志华. 基于集成的年龄估计方法. 自动化学报, 2008, 34(8): 997-1000. doi: 10.3724/SP.J.1004.2008.00997

http://www.aas.net.cn/cn/article/doi/10.3724/SP.J.1004.2008.00997?viewType=HTML

[23] 高全学, 潘泉, 梁彦, 张洪才, 程咏梅. 基于描述特征的人脸识别研究. 自动化学报, 2006, 32(3): 386-392.

http://www.aas.net.cn/cn/article/id/15824?viewType=HTML

转载本文请联系原作者获取授权，同时请注明本文来自欧彦科学网博客。
链接地址：https://blog.sciencenet.cn/blog-3291369-1329321.html

上一篇：陈关荣教授：探索最优同步网络的拓扑结构（综述全文+PPT+直播回放）
下一篇：基于GBDT的铁路事故类型预测及成因分析

收藏 IP: 159.226.181.*| 热度|

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

数据加载中...

返回顶部

欧彦

扫一扫，分享此博文

全部作者的精选博文

• 2023年度自动化领域国家自然科学基金申请与资助情况

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深度学习的抗年龄干扰人脸识别

当前推荐数：0

该博文允许注册用户评论请点击登录评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于深度学习的抗年龄干扰人脸识别

当前推荐数：0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

欧彦

全部作者的精选博文

全部作者的其他最新博文

全部精选博文导读

该博文允许注册用户评论请点击登录评论 (0 个评论)