|
视频人体姿态估计的任务是恢复视频中人体各主要关节点的位置,是目前计算机视觉领域的研究热点,在行为识别、人机交互、视频理解等领域均有广泛的应用。
针对图像的人体姿态估计近些年虽已取得长足进展,但是面对非常规人体姿态,其结果并不理想。如何在视频中借助运动信息,提高对非常规人体姿态的估计精度,是一个值得研究的问题。
一个有效的解决方案是在人体部件模型基础上,添加时域约束,构建一个以人体部件为实体的细粒度时空概率图模型,推理获取每一时刻各人体部件的最优状态。由于人体姿态变化的多样性, 人的体型、穿着、视角等变化,部件模型很难捕捉到所有的表观变化,而时域上只引入了相邻帧间的一致性约束,没有长时一致性的约束,易出现部件状态估计的误差累积。另外由于模型存在环路,无法获取精确解,近似推理也在一定程度上进一步降低估计的精度。
本文加大时空模型中实体粒度,以推理符合时空约束的部件轨迹片段为目标,由轨迹片段拼接融合得到最终结果。
文章方法的整体流程如下所示:
目前,深度学习在人体姿态估计问题上取得了令人瞩目的成绩,如何结合传统的机器学习方法与深度学习方法,解决视频中的人体姿态估计是下一步的研究计划。
引用格式:史青宣, 邸慧军, 陆耀, 田学东. 基于中粒度模型的视频人体姿态估计. 自动化学报, 2018, 44(4): 646-655.
链接:http://www.aas.net.cn/CN/abstract/abstract19256.shtml
PDF:http://www.aas.net.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=19256
作者简介:
史青宣, 河北大学网络空间安全与计算机学院讲师. 北京理工大学计算机学院博士研究生. 主要研究方向为计算机视觉, 模式识别.
E-mail: shiqingxuan@bit.edu.cn
邸慧军, 北京理工大学计算机学院讲师. 主要研究方向为计算机视觉, 模式识别,机器学习.
E-mail: ajon@bit.edu.cn
陆耀, 北京理工大学计算机学院教授. 主要研究方向为神经网络, 图像和信号处理, 模式识别. 本文通信作者.
E-mail: vis yl@bit.edu.cn
田学东, 河北大学计算机科学与技术学院教授. 主要研究方向为模式识别与图像处理.
E-mail: txd@hbu.edu.cn
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-24 08:21
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社