|
动态系统: 模型不确定性(假设某种uncertainty set) + 在线学习。
如何给 robust model with learning 这个合乎人做决策时思路的一个一般化的框架?
Predict + correct (a primal-dual framework).
单纯的 robust model 不考虑 learning.
单纯的 learning 在建模时强调的是参数的未知性,而不是模型的不确定性。
约束的引入,就自然引入了duality.
Occupation measure vs Pon Maximum principle 关系。
另外,online convex optimization 与 输出调节的关系。
输出反馈LQG:估计与控制器设计的分离。
Multi arm bandit: UCB (一种Optimistic optimization)。
一般来说,估计与控制器设计是不可以分开设计。郭雷当年做
随机自适应控制下最小二乘的收敛性的根本性困难。
控制论与信息论的结合点:控制的反馈极限,总是跟这个被控系统
的不确定性有关系,这里的不确定性可以被信息论里的entropy 刻画。
Entropy 是一种隐藏的很深,但是又无处不在的一个量,这个量总是
刻画着可行与不可行的边界。
人的有效思考总是借助某种框架,但是本质的创新又必须跳出这个
框架。这就注定了真正的创新无法来自于某种预设的模式。创造性,
是来自于非理性,比如激情,和谐感,美感,神圣感。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-23 00:34
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社