动态规划与最优控制——近似动态规划(第I卷)

2025-10-9 233 10/9

动态规划与最优控制——近似动态规划(第I卷)

作者:[美]德梅萃·P. 博塞克斯(Dimit

页数:392

出版社:清华大学出版社

出版日期:2024

ISBN:9787302659716

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

本书系统性介绍动态规划与第一控制,包括动态规划算法、确定性系统与随机最短路问题、确定性连续时间第一控制、状态信息完整的问题、状态信息缺失的问题、次优与适应控制、无穷阶段问题等。

作者简介

贾庆山,清华大学自动化系副教授,2002年和2006年分别于清华大学自动化系获工学学士、博士学位,同年留校任教。2006、2010、2013年分别任美国哈佛大学、香港科技大学、美国麻省理工学院访问学者。作为负责人先后承担国家自然科学基金青年基金、面上项目、优秀青年基金,参加国家自然科学基金重点项目、重大研究计划培育项目和集成项目。承担多个国际合作项目。任IEEE Transactions on Automation Science and Engineering、Discrete Event Dynamic Systems - Theory and Applications等国际期刊副编辑,IIE Transactions领域编辑。发表国际期刊论文和国际会议论文逾八十篇,合著英文专著一部,合编英文专著一部,合译教材一本。

本书特色

本书是MIT博塞克斯教授的一本力作,分两卷,本书是第I卷,主要介绍动态规划与最优控制的基本方法,包括最短路径问题、精确和不精确状态信息、有限与无限阶段问题等经典模型,以及近似动态规划等理论方法。本书体现了博塞克斯教授著作的一贯的特点,深入浅出,适于自学,相信读者会有愉快的阅读与学习体验。

目录

第 1章动态规划算法 1
11概述 1
12基本问题 8
13算法12
14状态增广和其他重新建模24
15一些数学问题 29
16动态规划和极小化极大控制 32
17注释、参考文献和习题 35
第 2章确定性系统和最短路径问题 44
21有限状态系统和最短路径44
22一些最短路径的应用 47
221关键路径分析 47
222隐马尔可夫模型和瓦特比算法48
23最短路径算法 53
231标签纠正方法 55
232标签纠正变形-A*算法 60
233分支定界61
234约束与多目标问题 63
24注释、参考文献和习题 67
第 3章确定性连续时间最优控制 72
31连续时间最优控制72
32哈密尔顿-雅可比-贝尔曼方程 74
33庞特里亚金最小值原理 79
331使用 HJB方程的非正式推导 79
332一种基于变分思想的推导 86
333离散时间问题的最小值原理 89
34最小值原理推广 90
341固定的末端状态91
342自由初始状态 93
343自由终止时间 94
344时变系统与费用97
动态规划与最优控制——近似动态规划 (第 I卷)
345奇异问题97
35注释、参考文献和习题 99
第 4章具有精确状态信息的问题 103
41线性系统和二次型费用 103
42库存控制 112
43动态资本分析 119
44最优停止问题 122
45调度与交换的理由 130
46不确定性的集合隶属度描述 133
461集合隶属度估计 133
462具有未知且有界扰动的控制 138
47注释、参考文献和习题 140
第 5章不精确状态信息的问题 152
51化简为精确信息的情形 152
52线性系统和二次型费用 160
53线性系统的最小方差控制 165
54充分统计量 176
541条件状态分布 177
542有限状态系统 180
55注释、参考文献和习题 190
第 6章近似动态规划 198
61确定性等价和自适应控制 199
611谨慎、探测和对偶控制 203
612两阶段控制和识别能力 204
613确定性等价控制和可辨识性 205
614自调节调节器 209
62开环反馈控制 210
63有限前瞻策略 213
631有限前瞻策略的性能界 214
632有限前瞻中的计算问题 217
633问题近似——强化分解 219
634集结 223
635后续费用的参数化近似 227
64滚动算法 234
641离散确定性问题 239
642由仿真评价的 Q-因子 251
目录 IX
643 Q-因子近似 253
65模型预测控制及相关方法 255
651滚动时段近似 255
652模型预测控制中的稳定性问题 257
653结构受限的策略 262
66近似动态规划中的额外主题 266
661离散化 266
662其他近似方法 268
67注释、参考文献和习题 269
第 7章无限阶段问题介绍 280
71概览 280
72随机最短路径问题 282
73折扣问题 290
74每阶段平均费用问题 293
75半马尔可夫问题 303
76注释、参考文献和习题 310
附录 A数学知识复习 320
A1集合 320
A2欧氏空间 321
A3矩阵 321
A4分析 324
A5凸集和凸函数 325
附录 B优化理论 327
B1最优解 327
B2最优性条件 328
B3二次型最小化 329
附录 C概率论 330
C1概率空间 330
C2随机变量 330
C3条件概率 331
附录 D关于有限状态马尔可夫链 333
D1平稳马尔可夫链 333
D2状态分类 334
D3极限概率 334
动态规划与最优控制——近似动态规划 (第 I卷)
D4首达时间 335
附录 E卡尔曼滤波 336
E1最小二乘估计 336
E2线性最小二乘估计 337
E3状态估计——卡尔曼滤波器 342
E4稳定性方面 346
E5高斯-马尔可夫估计器 347
E6确定性最小二乘估计 349
附录 F随机线性系统模型 351
F1具有随机输入的线性系统 351
F2具有有理数谱的过程 352
F3 ARMAX模型 353
附录 G不确定性下的决策问题建模 354
G1不确定性下的决策问题 354
G2期望效用理论和风险 357
G3随机最优控制问题 365
参考文献 369

PDF更新中
- THE END -

非特殊说明,本博所有文章均为博主原创。