IEEEJAS的个人博客分享 http://blog.sciencenet.cn/u/IEEEJAS

博文

基于改进高斯混合模型的机器人运动状态估计

已有 1998 次阅读 2022-8-5 16:46 |系统分类:博客资讯

引用本文

 

葛泉波, 王贺彬, 杨秦敏, 张兴国, 刘华平. 基于改进高斯混合模型的机器人运动状态估计. 自动化学报, 2022, 48(8): 1972−1983 doi: 10.16383/j.aas.c200660

Ge Quan-Bo, Wang He-Bin, Yang Qin-Min, Zhang Xing-Guo, Liu Hua-Ping. Estimation of robot motion state based on improved Gaussian mixture model. Acta Automatica Sinica, 2022, 48(8): 1972−1983 doi: 10.16383/j.aas.c200660

http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c200660

 

关键词

 

非线性非高斯系统,状态估计,高斯和容积卡尔曼滤波,鲁棒期望最大化算法,凸组合融合 

 

摘要

 

针对复杂环境下机器人运动状态估计的精度改善问题, 提出一种面向非线性非高斯系统的改进高斯和容积卡尔曼滤波估计方法. 首先, 引入加权信息量概念来改进期望最大化算法目标函数惩罚项, 使得在优化过程中能考虑更全面的参数信息, 以达到减少期望最大化算法的迭代次数和提高收敛速度的目的. 此外, 以基于马氏距离和Kullback-Leibler (KL)距离的高斯项合并方法为基础, 提出一种能有效联合两类高斯项合并方式的融合模式. 先单独使用马氏距离和KL距离进行高斯混合项合并, 再对获得的高斯混合项进行加权融合处理, 以改善高斯和滤波中多高斯项的合并性能和保真度. 最后, 应用非线性非高斯系统的高斯和容积卡尔曼滤波框架实现对复杂环境下机器人的运动状态估计. 理论分析与仿真结果表明, 该方法能实现对机器人运动更好的状态估计精度, 并具有更强的鲁棒性能.

 

文章导读

 

状态估计理论被广泛应用于各领域, 例如太空监测[1]、无线通信、机器人运动跟踪以及金融行业等[2]. 当系统为线性、噪声统计特性服从高斯分布并完全已知时, 卡尔曼滤波器是最优的解决方案[3-4]. 在大多数实际工程应用中, 系统往往存在非线性、非高斯等复杂特征, 此时若采用经典卡尔曼滤波方法来对实际系统进行状态估计, 将出现估计精度下降和收敛性变差等情形, 甚至会出滤波发散现象, 这严重制约了经典卡尔曼滤波理论在实际工程中的应用. 因此, 深入开展非线性非高斯系统下的卡尔曼滤波方法研究具有重要的意义.

 

近几十年来, 研究人员已提出诸多面向非线性系统的卡尔曼滤波方法, 如扩展卡尔曼滤波、无迹卡尔曼滤波、容积卡尔曼滤波(Cubature Kalman filter, CKF)[5], 以及一些相应的改进算法. 其中, 扩展卡尔曼滤波因结构简单在早期大受欢迎, 但该方法只能处理弱非线性问题, 当系统非线性增强时其估计性能将急剧下降; 与扩展卡尔曼滤波相比, 无迹卡尔曼滤波引入了采样近似技术, 估计精度和稳定性有了很大提升; CKF则是在无迹卡尔曼滤波基础上提出的一种改进型卡尔曼滤波方法, 基于三阶球面径向容积准则来进行采样近似, 是理论上当前最接近贝叶斯滤波的基础性非线性滤波算法. 现有研究表明, CKF的数值稳定性及滤波精度优于传统的扩展卡尔曼滤波和无迹卡尔曼滤波, 尤其是在高维非线性系统状态估计中具有更为明显的算法优势[6-7].

 

此外, 针对非高斯系统的状态估计问题研究也取得一些进展, 目前已建立了基于高斯和、粒子滤波和极大相关熵等技术在内多种非高斯滤波方法[8]. 文献[9]基于最大相关熵准则提出一种适用于非高斯噪声的卡尔曼滤波算法, 但是其高斯核大小对结果影响较大. 为了克服这一缺陷, 研究者们对极大相关熵准则中的核函数进行一系列的改进[10], 如对高斯核大小进行自适应处理, 但都难以从根本解决对核敏感的问题. 高斯和技术是一种比较直观和受欢迎的非高斯处理方法之一, 其基本原理是采用多个有限高斯项概率密度去逼近非高斯概率密度, 即利用多个高斯分布的和去近似表示一个非高斯分布, 从而可以基于传统的卡尔曼滤波框架实现滤波[11]. 因此, 通过将高斯和技术和CKF结合, 可进一步构建相应的滤波算法来解决非线性非高斯系统的状态估计问题[312]. 事实上, 高斯和滤波器设计的关键问题主要包括高斯混合模型的参数估计和高斯项优化合并[13-14], 其中高斯混合模型参数估计主要采用期望最大化(Expectation-maximum, EM)算法, 该算法是由Dempster[15]1977年提出的一种迭代算法, 其通过估计参数的极大似然值来分析不完全数据集, 从而达到获取最佳聚类结果的目的. 然而, EM算法存在对初始值比较敏感、收敛速度慢、容易陷入局部收敛以及需要知道混合成分个数等缺陷, 在工程应用受到极大的限制[16-17], 依然有待进一步深入改进. 此外, 在高斯和滤波过程中, 高斯项的个数会呈指数型递增, 这使得对高斯项进行合理有效地合并就显得非常必要. 目前典型用于高斯项合并的距离度量包括马氏(Mahalanobis)距离和Kullback-Leibler (KL)距离[18-19], 其中马氏距离度量倾向于采用剪枝方式来删除权重较低的高斯项, KL距离度量更倾向于合并而不是剪枝方式[19]. 由于这两种高斯混合项处理方式机理不同, 所产生的高斯项约简效果也有差异, 一般很难从理论上验证孰优孰劣.

 

针对上述问题, 本文以自由度为3 (包括xy与朝向) 的地面移动机器人的运动状态估计系统为对象, 提出一类改进的非线性非高斯CKF的设计. 该工作主要创新包括建立一种改进的鲁棒EM算法, 并提出了基于信息融合技术的高斯项合并方法. 在鲁棒EM算法改进方面, 本文将引入加权信息量概念来进一步完善EM算法中的目标函数惩罚项, 使得在优化过程中能考虑包括隐含信息量在内的更全面的参数信息. 通过这种方式, 得到的权重更新参数将更具有代表性, 从而减少EM算法的迭代次数并提高其收敛速度. 在高斯项合并方法方面, 综合考虑上述两类高斯项合并方法原理和性能上的差异性和互补性, 基于信息融合技术提出一种新的高斯合并项融合方法: 先单独对马氏距离和KL距离度量进行高斯混合项合并, 以改善高斯项合并距离度量的合理性; 再以两个距离度量独立运行输出的高斯合并项为基础, 提出对两类高斯合并项进行加权融合的高斯混合项融合方法. 基于传统高斯和容积卡尔曼滤波的设计框架, 本文提出新型非线性非高斯滤波方法, 并通过理论分析和机器人转弯运动状态估计仿真场景来验证新算法的有效性.

 1  高斯和容积卡尔曼滤波算法流程

 2  EM算法迭代流程

 6  鲁棒EM算法迭代过程

 

针对非高斯非线性环境下的机器人状态估计问题, 本文首先对于非高斯噪声环境建立高斯混合模型, 并利用改进的鲁棒EM算法进行高斯混合模型参数的求解, 相比传统EM算法, 改进鲁棒EM算法对于初始参数不敏感, 不需要提前设定混合成分个数. 其次, 利用由改进鲁棒EM算法得到的高斯混合模型参数, 进行高斯和容积卡尔曼滤波的设计. 考虑到高斯和滤波过程中会出现高斯项冗余的情况, 本文利用凸组合融合, 得到了Salmond方法与B(⋅)准则方法两种方法合并后的高斯混合项, 并给出相应的理论分析和对比仿真实验. 结果表明, 经过融合后滤波算法的状态估计精度相比于传统的两种方法有明显的提升. 同时, 通用场景下的飞行测试数据验证分析也表明了新方法的有效性. 未来进一步究工作包括有效高斯项数目动态优化、非高斯噪声统计特性动态估计、更多合并距离方法的融合策略以及复杂场景的数据非高斯动态建模和基于可信度高斯和滤波器设计等.

 

作者简介

 

葛泉波

南京信息工程大学教授. 主要研究方向为工程信息融合理论与方法, 无人系统协同优化, 人机混合系统智能评估和智能电网大数据分析. 本文通信作者. E-mail: QuanboGe@163.com

 

王贺彬

2021年获得杭州电子科技大学硕士学位. 主要研究方向为多智能体控制和非线性非高斯状态估计. E-mail: syeaxb@163.com

 

杨秦敏

浙江大学控制科学与工程学院教授. 主要研究方向为工业大数据, 智慧能源系统和信息驱动的控制与优化. E-mail: qmyang@zju.edu.cn

 

张兴国

中国飞行试验研究院高级工程师. 主要研究方向为飞行器试飞测试技术和智能化测试技术. E-mail: cftezhang@qq.com

 

刘华平

清华大学计算机科学与技术系副教授. 主要研究方向为机器人感知, 学习与控制和多模态信息融合. E-mail: hpliu@tsinghua.edu.cn



https://blog.sciencenet.cn/blog-3291369-1350103.html

上一篇:DoS攻击下具备隐私保护的多智能体系统均值趋同控制
下一篇:视频压缩感知多假设局部增强重构算法
收藏 IP: 222.131.244.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 07:34

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部