ustcpress的个人博客分享 http://blog.sciencenet.cn/u/ustcpress

博文

《摄动马尔可夫决策与哈密尔顿圈》刘克

已有 3905 次阅读 2012-4-9 10:09 |个人分类:校友文库|系统分类:科研笔记| 马尔可夫决策, 哈密尔顿圈

丛书名:当代科学技术基础理论与前沿问题研究丛书——中国科学技术大学校友文库
(“十一五”国家重点图书出版规划项目)
出版日期:2009年4月
书号ISBN:978-7-312-02241-8
出版社:中国科学技术大学出版社
正文页码:348页(16开)
字数:390千
定价:58.00元
编辑邮箱:edit@ustc.edu.cn(欢迎来索要目录、样章的PDF)
 

内容简介
本书适用于三种读者,一个是希望利用马氏决策过程建立有效的模型来分析决策行为的读者,通过前四章的阅读可以了解基本的分析工具,后面的阅读可以使读者获得建立具体模型并进行分析的一些技巧;二是为希望利用这个随机优化的工具研究离散数学或者其他相关科学里的问题的读者提供思路;最后,对于希望发展马氏决策过程理论的读者,可以了解这方面的动态,尽快介入这方面的前沿研究领域。马氏决策过程是一个非常有用的决策分析工具,已经成功的用于解决很多实际问题。利用马氏决策过程的建模思想,可以将一些离散数学中的传统问题描述为特殊的马氏决策过程加以考虑。通过优化这些特殊的马氏决策过程,不仅可以为解决这些传统问题提供新的思路,而且还可以促进马氏决策过程本身理论的发展。但是,在研究这类特殊马氏决策过程时,只有引入摄动因素才能有效的处理问题,所以我们还介绍了马氏决策的摄动理论。本书的内容包括一些基本的马氏决策过程知识,主要集中在有限状态和有限行动的马氏决策过程上。然后介绍了有关马氏决策过程的摄动理论。最后,利用前面的内容,比较详细的介绍了摄动马氏决策与哈密尔顿圈之间的关系和近些年的最新研究成果,提出了一些这个领域里人们现在最为感兴趣的研究问题。


作者简介
刘克,中国科学院数学与系统科学研究院研究员,
1982年毕业于中国科大数学系,在中科院应用数学所工作并一直从事马氏决策过程的理论与应用研究工作。后在南澳大利亚大学获得博士学位,博士论文:摄动马氏决策过程的理论与应用。现为中科院数学与系统科学研究院研究员,博士生导师。目前感兴趣的研究方向是:随机优化理论和供应链管理、软件可靠性数学、并发式计算理论、监管理论等等。

 

【目录】
总序
前言
主要符号表
第一部分 马氏决策过程与摄动
1 绪论
1
1 序列决策模型
1
2 马氏决策过程的例子
1
3 马氏决策过程的定义与记号
1
31 决策时刻与周期
1
32 状态与行动集
1
33 转移概率和报酬
1
34 历史、决策规则与策略
1
35 诱导过程、效用准则与马氏策略优势
1
4 马氏决策过程的起源和发展

2 有限阶段模型
2
1 最优准则
2
2 有限阶段的策略迭代和最优方程
2
3 最优策略的存在性和算法
2
4 最优策略的结构
2
5 单调策略的最优性

3 无限阶段折扣模型
3
1 最优准则
3
2 最优方程
3
3 最优策略的存在性
3
4 策略迭代算法
3
5 值迭代算法
3
6 改进的策略迭代算法
3
7 线性规划算法
3
8 最优单调策略
3
9 最优策略的结构

4 无限阶段平均模型
4
1 最优准则
4
2 最优平稳策略的存在性
4
3 平稳策略的一些特征
4
4 最优方程与策略迭代算法
4
5 单链的线性规划与相关问题
4
51 极限平均频率
4
52 带约束模型问题
4
53 方差问题
4
6 多链的线性规划与相关问题
4
61 对偶可行解与随机平稳策略
4
62 基本可行解与确定性决策规则
4
63 最优解与最优策略
4
7 平均准则下的Bellman最优原则

5 摄动MDP
5
1 预备知识
5
2 一些基本记号和定义
5
3 摄动平均问题的渐进性和极限控制原则
5
4 折扣准则的摄动问题
5
5 一般的摄动
5
6 单摄动极限平均MDP的算法
5
61 假设与渐进性质
5
62 数学规划和极限马尔可夫决策问题
5
63 聚合一分解算法
5
7 进一步的研究进展
5
71 折扣权重摄动模型
5
72 折扣平均权重摄动问题

第二部分 摄动MDP与哈密尔顿圈
6 HCMDP
6
1 哈密尔顿圈问题
6
2 有向图到MDP的嵌入
6
3 平稳策略的分类
6
4 约束折扣MDPHC
6
5 约束折扣MDP的求解
6
6 HCTSP

7 HCP嵌入MDP的摄动
7
1 转移概率的摄动
7
11 转移概率的对称线性摄动
7
12 转移概率的非对称线性摄动
7
13 转移概率的非对称二次摄动
7
2 摄动下子图的稳态分布
7
3 非对称线性摄动下的几个例子
7
4 非对称线性摄动下HC的性质
7
5 更为精细的分析
7
6 开问题和有关猜想

8 频率空间上的分析
8
1 长期平均MDP频率空间中的HCP
8
2 二次非对称摄动与新目标函数
8
3 启发式内点算法
8
31 内点算法简介
8
32 关于(QP)求解的启发式算法
8
33 数值计算例子
8
4 一些开问题及其他

9 双随机摄动与HC
9
1 基本矩阵
9
2 再谈双随机摄动
9
3 渐进表达式
9
4 优化问题与HC的全局最优性
9
41 非线性规划问题
9
42 方向导数
9
43 HC既是局部也是全局最小
9
5 哈密尔顿间隙
9
6 对称双随机矩阵的探讨
9
7 混合时间及其变化的最小化
9
71 从不可约链到一般的情形
9
72 迹与对角线上的元素
9
73 摄动带来的好处
9
74 带有对称线性摄动的双随机矩阵

10 将来的研究方向和结束语
10
1 将来的研究方向
10
2 结束语
参考文献
索引



https://blog.sciencenet.cn/blog-502977-557077.html

上一篇:《电分析化学原理》(第2版)吴守国、袁倬斌
下一篇:《天体物理概论》(彩色版)向守平
收藏 IP: 202.38.86.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 22:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部