||
求解动态规划(dynamical programming)的主要方法,还是将动态规划的状态量增加一个维度,使得通过决策变量得维度抬高,将动态规划变成静态的规划进行求解。比如说,如果状态变量是3个分量的向量,时间是十个时间段的向量,可以将整个变量转为3X10的2维向量来做。只是本质上还是有限维(30个分量)的向量,所以如果是线性的,可以通过线性规划来做。如果非线性的,那就只能穷举法了,理论上还是很难求全局最优解了。
而动力系统(dynamical system)虽然从线性规划的角度说,只有状态转移方程和初边值条件的约束,理论上应该是简单的动态规划。但是由于它在时间轴上是0到正无穷,即使将时间网格离散化,它的目标函数也是一个无穷级数,理论上来说是很难求最小值的,除非证明该无穷级数收敛。所以似乎如果能够估计出解的有界性,就能用动态规划的思想来对目标函数寻极值进行求解了。实际上还是有例外的,比如系统里面的一些混沌现象和图灵斑图现象,它对于初始值高度敏感性说明动态规划的目标函数求极值方法是不稳定的,会带来极大的误差。
那么微分方程里的李雅普诺夫方法和能量泛函的方法也是求极值,似乎就是动态规划目标函数寻极值的思路啊。估计这就是李雅普诺夫方法的强大之处了,它能够突破维度从有限到无限的限制,能够找到一个条件将有限维和无穷维动力系统打通,并且给出了计算的思路和方向。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-24 02:47
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社