第二章 动态规划
(Dynamic Programming)
2.1 动态规划的基本概念与方法
2.2 动态规划应用举例
http://www.tju.edu.cn
第二章动态规划
2.1 动态规划的基本概念与方法一、多阶段决策问题举例
1,时间阶段例子(生产负荷问题) 某种机器可以在高、低两种负荷下进行生产。高负荷年产量
8,年完好率0.7;低负荷年产量5,年完好率0.9。
现有完好机器1000台,需制定一个5年计划,以决定每年安排多少台机器投入高、低负荷生产,
使5年的总产量最大。
123
45
S
1
=1000
x
1
x
2
x
5
x
4
x
3
s
5
v
1
v
2
v
3
v
4
v
5
s
2
s
3
s
4
http://www.tju.edu.cn
第二章动态规划
2.空间阶段的例子(最短路问题) 如图为一线路网络。现要从A点铺设一条管道到E点,图中两点间连线上数字表示两点间距离。现需选一条由A到E的铺管线路,使总距离最短。
A
E
B
1
B
2
B
3
C
1
C
2
C
3
D
1
D
2
29
5
3
12
2
5
1
5
6
4
6
8
10
13
12
11
14
10
阶段1 阶段2 阶段3 阶段4
http://www.tju.edu.cn
第二章动态规划二、基本概念与方程
1、基本概念阶段 ——分步求解的过程,用阶段变量 k表示,
k=1,…,n
状态 ——每阶段初可能的情形或位置,用状态变量
S
k
表示。 动态规划中的状态应具有无后效性。
决策 ——每阶段状态确定后的抉择,即从该状态演变到下阶段某状态的选择,用决策变量 x
k
表示。
http://www.tju.edu.cn
第二章动态规划状态转移 ——由 S
k
转变为 S
k+1
的规律,记 S
k+1
=T(S
k,
x
k
)。
策略 ——由各阶段决策组成的序列,记 P
1n
={x
1,…,
x
n
},
称 P
kn
={x
k,…,
x
n
}为阶段 k至 n的后部子策略。
阶段指标 ——每阶段选定决策 x
k
后所产生的效益,记
v
k
= v
k
(S
k,
x
k
)。
指标函数 ——各阶段的总效益,记相应于 P
kn
的指标函数为 v
kn
= v
kn
(S
k,
P
kn
)。
其中最优的称 最优指标函数,记 f
k
= f
k
( S
k
)=opt v
kn
。
http://www.tju.edu.cn
第二章动态规划问题:动态规划的最优解和最优值各是什么?
——最优解:最优策略 P
1n
,
最优值:最优指标 f
1
。
http://www.tju.edu.cn
第二章动态规划
(1)基本原理
{}。有和允许状态
(对任何是最优策略定理:
1111
11
1
,
)1),,(
+
+=
<<?=
kk
p
nn
fvoptfs
nkkxxP
k
(Dynamic Programming)
2.1 动态规划的基本概念与方法
2.2 动态规划应用举例
http://www.tju.edu.cn
第二章动态规划
2.1 动态规划的基本概念与方法一、多阶段决策问题举例
1,时间阶段例子(生产负荷问题) 某种机器可以在高、低两种负荷下进行生产。高负荷年产量
8,年完好率0.7;低负荷年产量5,年完好率0.9。
现有完好机器1000台,需制定一个5年计划,以决定每年安排多少台机器投入高、低负荷生产,
使5年的总产量最大。
123
45
S
1
=1000
x
1
x
2
x
5
x
4
x
3
s
5
v
1
v
2
v
3
v
4
v
5
s
2
s
3
s
4
http://www.tju.edu.cn
第二章动态规划
2.空间阶段的例子(最短路问题) 如图为一线路网络。现要从A点铺设一条管道到E点,图中两点间连线上数字表示两点间距离。现需选一条由A到E的铺管线路,使总距离最短。
A
E
B
1
B
2
B
3
C
1
C
2
C
3
D
1
D
2
29
5
3
12
2
5
1
5
6
4
6
8
10
13
12
11
14
10
阶段1 阶段2 阶段3 阶段4
http://www.tju.edu.cn
第二章动态规划二、基本概念与方程
1、基本概念阶段 ——分步求解的过程,用阶段变量 k表示,
k=1,…,n
状态 ——每阶段初可能的情形或位置,用状态变量
S
k
表示。 动态规划中的状态应具有无后效性。
决策 ——每阶段状态确定后的抉择,即从该状态演变到下阶段某状态的选择,用决策变量 x
k
表示。
http://www.tju.edu.cn
第二章动态规划状态转移 ——由 S
k
转变为 S
k+1
的规律,记 S
k+1
=T(S
k,
x
k
)。
策略 ——由各阶段决策组成的序列,记 P
1n
={x
1,…,
x
n
},
称 P
kn
={x
k,…,
x
n
}为阶段 k至 n的后部子策略。
阶段指标 ——每阶段选定决策 x
k
后所产生的效益,记
v
k
= v
k
(S
k,
x
k
)。
指标函数 ——各阶段的总效益,记相应于 P
kn
的指标函数为 v
kn
= v
kn
(S
k,
P
kn
)。
其中最优的称 最优指标函数,记 f
k
= f
k
( S
k
)=opt v
kn
。
http://www.tju.edu.cn
第二章动态规划问题:动态规划的最优解和最优值各是什么?
——最优解:最优策略 P
1n
,
最优值:最优指标 f
1
。
http://www.tju.edu.cn
第二章动态规划
(1)基本原理
{}。有和允许状态
(对任何是最优策略定理:
1111
11
1
,
)1),,(
+
+=
<<?=
kk
p
nn
fvoptfs
nkkxxP
k