第六章最优控制
6.1 引言
6.2 最优控制的一般概念
6.4 有约束条件的泛函极值问题
6.3 无约束条件的泛函极值问题
6.5 变分法求解最优控制问题
6.6 极小值原理教学要求:
1,学习泛函变分法,理解最优控制的一般概念
2,掌握利用变分法求最优控制方法
3.掌握状态调节器,极小值原理重点内容,
最优控制的一般问题及类型,泛函与变分,欧拉方程,横截条件 。
变分法求有约束和无约束的最优控制 。
连续系统的极小值原理 。
有限和无限时间状态调节器方法,Riccati方程求解 。
6.1 引言
1,经典控制理论设计控制方法幅值裕量,相位裕量 (频率指标)
上升时间,调节时间,超调量 (时域指标)
特点:系统的控制结构是确定的,控制参数设计一般采用试凑方法,不是最优结果。
为了使控制系统达到要求的控制精度,
对被控对象参数已知,采用最优控制。
2,最优控制理论是现代控制理论的 核心,
20世纪 50年代发展起来的,已形成系统的理论。
最优控制,在系统状态方程和约束条件给定的情况下,寻找最优控制律,使衡量系统的性能指标达到最优(最小或最大)
极值控制。
某一性能指标最优:时间最短,燃料消耗最少。
3,主要内容,变分法,极小值原理 (庞特里亚 1958),二次型调节器,动态规划 (
贝尔曼 1957)
举例:飞船软着陆:在月球表面着陆时速度必须为零,由发动机的推力变化来完成。
mg
tu
thtv
月球问题:如何选择推力,使燃料消耗最少。
thtv
tu
g
tm
M
高度 速度发动机推力月球表面重力加速度登月舱质量料)登月舱的自重(不含燃初始条件:
登月舱初始质量初始变量初始速度初始时间,末端时间
00 mFMm
00 hh
00 vv?
00?t
ft
.atvth
gtm tutv
tkutm k 常数边界条件初始条件末端条件控制约束,(发动机最大推力)
性能指标,选择 使燃料最省
4,最优控制四个要素
( 1)
.b
0,0 ff tvth
.c m a x0 utu
.d,* tufthth?0
m a x ftmJ?
ttutxftx,, pn RtuRx,
连续向量函数,且 连续可微,
在 上分段连续。
边界条件初态 终态求 最优轨线一般 已知,固定,自由目标集连续可微向量函数
1ttutxftx,, pn RtuRx,
nRf ttx,
tu
ftt,0
2
00 xtx ff xtx?
ftxtx?0xt00,txt
ff txt,
0,?ff ttx?
rR nr?
容许控制控制域(取值范围)
分段连续性能指标泛函 求泛函极值。
一般形式:
最优控制的数学描述:
3
tu?
tu
4
uJ
ttutxfx,,

0
,,,
ft
ff
t
J x t t F x u t dt

00 xtx ff xtx?
uJm intxtu **?
1
Jmin
2
tu
ts.
.atuxftx,,
00 xtx?
.b
0,?ff ttx?
最优控制问题的解存在条件,完全能控采用状态状态反馈 最优控制
6.2 最优控制的一般概念
1,最少时间控制它要求设计一个快速控制系统,使系统在最短时间内从初态 终态如:导弹拦截器的轨道转移 。
0
0
ttdtJ
ft
t
f
0txftx
2,最少燃料燃料,如:航天器携带燃料有限,
尽可能少消耗燃料。
3,最少能量控制与消耗的功率成正比,如:
通信卫星的太阳能电池。

0
1
ft m
j
jt
J u t dt

ju?
dttutuJ
ft
t
T
0
tutu T
4,线性调节器有限时间,
无限时间,
线性调节器:
dttRuutQxtxtPxtxJ
ft
t
TT
ff
T
1
2
1
2
1
0,0,0,0TP Q R R R
ft
dttRututQxtxJ
t
TT?

0
2
1
0 0x t x? 0ft?
5,线性跟踪器线性状态跟踪线性输出跟踪令:
有限:
txtx d
tyty
d?
txtxte d
tytyte d
dttRututQetetPeteJ
ft
t
TT
ff
T
0
2
1
2
1
无限:
如:导弹、航天器指令信号跟踪。
6,性能指标
( 1)积分型性能指标( 问题)
dttRututQeteJ
t
TT?

0
2
1
La g ra in
dtttutxFJ
ft
t

0
,,
( 2)终值型性能指标( 问题)
( 3)复合型性能指标( 问题)
7,主要数学方法最优控制必要条件一组方程或不等式
Mayer
ff ttxJ,
Bolza
dtttutxFttxJ
ft
t
ff,,,
0

最优化问题解析法数值计算法,多项式插值
6.3 最优控制中的变分法
1,泛函与变分的基本概念变分法无约束?
极值原理、动态规则有约束?
区间消去法爬山法梯度法设对于自变量,存在一类函数,
对于每个函数,有一个 值与之对应,则变量 称为依赖于函数 的泛函数,简称泛函,记为 。
这里自变量仍是一个函数,故泛函也称函数的函数。
如:一个变速运动物体的动能:
tmvE 221dtttxtxFJ
ft
t

0
,,?
txJ
tx
ttx
tx J
J
注意,泛函 自变量是函数,函数自变量是变数。
又如,可积若
2,函数的变分泛函 的变量 的变分
dttxJ
t

0
tx
ttx?
ttx c o s?
2
2
1 txJ?
txJ s i n?
txJtx x?
宗量变分 表示 中点 与之间的差。
3,泛函的变分其中 参变数当
txtxx 0 nRtxtx 0,
xtxtx0nR
xxJx
10
1
0
xxJ
xJ
泛函变分的定义设 是线性赋范空间 上的连续泛函,其线性赋范空间:设 是实(
复)数域 上的一个线性空间。
存在非实数且满足:
.a
xJ nR
R
F
Rx x
01 0?x 且 0?x 0?x?
02 xx Rx? F
则将 线性赋范空间,范数线性泛函:
若 满足:
连续函数空间中的函数则称 为线性泛函
03 yxyx Ryx?,
R x
txJJ x J x
xJ
yx,
yJxJyxJ
xJ
其中增量可表示为:
其中 的线性连续函数关于 的高阶无穷小
xJxxJxJ
xxrxxL,,
xxL?,x?
xxr?,x?
且当 时,则为 的一阶变分 记为如:
0?x 0,?xxrxxL?,
xJxxLJ,?
dttxxJ
1
0
2
dttxdtxtxxJ
1
0
2
1
0
2?
dtxx d ttx
1
0
2
1
0
2
泛函变分求法定理:设 为线性赋范空间 上的连续泛函,若在 处 可微,其中
,则 的变分为:
.b
x d ttxJ
1
0
2
xJ nR
0xxxJ
nRxx?
0,xJ
xxJxxJ


00,0
10
证明,处 可微,则:
由于 是 的线性连续泛函,
又 关于 的高价无穷小
0x? J
00 xJxxJJ
xxrxxL,,00
xxL,0 x
xxLxxL,,00?
xxr,0
x

0,lim 00

xxr
0
0000 l i m J x x J xJ x x?





001l im,,L x x r x x



xxJ,0?
4,泛函的极值:
在 上达到极值的必要条件若:
则 在 处取极小(大)值
txJ 0x
0,000 xxJxxJ
0 0J J x J x
0 0J J x J x
xJ 0xx?
5,变分预备定理:
设 是 上连续的 维向量函数,是任意的 维连续向量函数,
且若则:
00 fthth

0
0
ft
T
t
t h t d t
0tfttt,0
t? 0,ftt n
()ht n
6.3 无约束条件的泛函极值问题设在 上 二次连续可微,已知求极值轨线
dtttxtxFJ
ft
t

0
,,?
ftt,0txxF,,?
00 xtx ff xtx?
nRx?
m i n* Jtx
tx*
设 是 邻域内的一条容许轨线泰勒展开式中的高阶项
txtx*
** xJxxJxJ
dttxxFtxxxxF
ft
t

0
,,,,****
0
ft TT
t
FF
x x H O T d t
xx




HOT F
由一阶变分定义,取 的线性主部其中代入上式,且令
0
ft TT
t
FFJ x x d t
xx




J?
x d t
x
F
dt
d
x
x
F
dtx
x
F fff
t
t
T
t
t
Tt
t
T



0
0
0

0?J?
00
0f f
TT
t t
tt
F d F FJ x d t x
x d t x x


由于 不受约束,任意,由前面变分预备定理,泛函 取极值的必要条件:
欧拉方程:
横截条件:
tx x?
J
0 xFdtdxF? 0xx
dFF
dt
0
0


ft
t
T
x
x
F?

0 0
0
f
TT
t f t
F x t x t
xx


例 1:求平面上两固定点连线最短的曲线解:
0t ft
t
tx
222 dtdxds
22 dtdxds
dtxdsJ
ft
t

0
21?
txF 21
由边界条件确定。
四种边界条件:
xxx Fdt
dF
dt
dF

c
x
x?
21?
atx battx
ba,
0t ft
t
tx
1x
2x
3x
给定,固定始端和固定终端边界条件:
0.,fa x t x t
0 0,xt 0?ftx?
00 xtx ff xtx?
任意,自由始端和自由终端任意边界条件:
0.,fb x t x t
ftxtx,0
0
0,tFx 0
ftx
F
0t ft
t
tx
1x
2x
3x
t
tx
0t ft
3x
2x
1x
任取,给定,自由始端、
固定终端,任意,
边界条件:
0.c x tftx
0tx 0?
ftx?
0
0,tF
x

()ffx t x?
给定,任取,固定始端、
自由终端 任意边界条件:
0.d x tftx
,00?txftx?
0?
ftx
F
00 xtx?
t
tx
0t ft
1x
2x
3x
例 2,
已知,求 的解:
dttxtxxJ
2
0
22
2
2
,0

xx
m in?Jxt?
22,xxxxF xxF 2
xxFdtd 2 0 xx
ttctctx s i n2s i nc o s 21*
12,0,2cc由边界条件
6.4 有约束条件的泛函极值问题设在 上,可微,
1,约束方程构造增广泛函:

dtttxtxFJ
ft
t

0
,,?
ftt,0 F
0,?txG mRG?
mn?
dttxGttxxFJ
ft
t
T
a
0
,,,
txGttxxFtxxL T,,,,,
拉格朗日乘子向量,
泛函极值的必要条件:
mRT
m ttt1?
0
0


dt
L
x
x
L
x
x
L
J
ft
t
TTT
a

0,L d L
x d t x


TGL?
2,约束方程如果:
如:
0,?txG 约束方程
0
0

ft
t
T
x
x
F?
横截条件
,,,0,G x x u t?
tuxfx,,
0,,,,, xtuxftuxxG
0,,,,2121?uxxxxG

ft
N
FdtJ
TL F G
例 1:,,已知求
0
11
xx L
dt
dL
0
22
xx L
dt
dL
0uudLL
dt

ux0txftx
dtuxJ
ft

0
22
*u m in?J
解:
dtxxdtuxJ
ff tt

0
22
0
22?
22 xxF
022

xx
x
F
dt
d
x
F
210 ccx
ff tt
f ececx

21
12()
ttx t c e c e
例 2,
ff
f
tt
t
f
ee
exx
c?
01
ff
f
tt
f
t
ee
xex
c?
02
dttuJ
2
0
2
2
1
txtx 21
tutx?2?
101?x
022?x
102?x
021?x
引入

t
t
t
2
1


ux
xx
uGFL T
2
21
21
2
2
1?

uxxxu 222112
2
1
1
11
0L d L
x d t x


常数
12
22
0L d L
x d t x


02

u
u
L
dt
d
u
L
11 a 12
212 ata 21 atau
21 aa,
由边界条件:
u d tx 2 32
2
12 2
1 atatatx
dtxx 21?
4322311
2
1
6
1 atatatatx
31a
2
7
2a
13?a 14?a
1
4
7
2
1 23*
1 ttttx
1
2
7
2
3 2*
2 tttx

2
73*
3 ttx
6.5 变分法求解最优控制问题设其中 (无约束开集)
求构造哈密顿函数 无约束其中 拉格朗日乘子向量
tuxftx,,
dttuxFttxJ
ft
t
ff
0
,,,?
nRx? pRu?
*um a xm i n?J
nR
tuxfttuxFtuxH T,,,,,,,
若,给定给定,任意(终端自由)
构造增广泛函:
0t
00 xtx?
ftftx

0
,,,
ft
T
af
t
J x t H x u t x d t
dtxtuxftuxFtxJ
ft
t
T
fa
0
,,,,


x
x
H
x
x
J
f
f
t
t
T
tt
T
a
0
0?


dtxx
H
u
u
H TT
TT

f
ff
t
t
T
t
t
TT
t
t
T xdtxxxd
0
00

x d txdtx
f
f
f t
t
Tt
t
T
t
t
T
0
0
0

x d tx
f
f
t
t
T
t
T
0
x
x
H
x
x
J
f
f
t
t
T
tt
T
a



0
0?

dtx
H
u
u
H
TT


由于 相互独立,且任意,,,uxtx
f

tuxHx,,,?

x
tuxH
,,,
0,,,?
u
tuxH?

f
f
f tx
tx
tx
状态方程伴随方程控制方程横截条件哈密顿正则方程

*x
*?
*u
例 1.
其中 给定,求解:
ux
00 xtx dtutcxJ ft
t
f
0
22
2
1
2
1
tu*? m in?J
00,,fc t t?
uufFH 221
0uuHu ①
xu u
0?

x
H c 常数
f
f
f
f tcxtx
tx
t?
00 xtx?
边条



② 与④
由状方:
代入边条:
ff tcxtt *

ftcxu *
常数
auttx
attcxxauttx f 0*000
0*0 ttcxxa f
ttcxttcxxtx ff *0*0*
当 时,
例 2.,,任意,求 使
ftt?
ffff ttcxttcxxtx *0*0*

0
0*
1 ttc
xtx
f
f

0
0*
1 ttc
cxtu
f
ux 10?xftx *u
m i n221
0
2 dtuxeJ t
解,给定,终端自由
ft
uuxeH t 222
uHx
txe
x
H 22

02 2 tueuH
tue 22
tt euxeuu 22 2222
txe 22
02 xxx 21
2,1
tt ecectx 212211
10?x 0
1
1?

x

221 1212
12

e
c

22
22
2 1212
12


e
ec

tt eccu 212211* 2121
xu tue 22
21,cc解出给定,终端约束设终端约束方程:
即终端状态 沿规定的边界曲线移动
2 ft

0,, fff txMttxM qRM?
ftx


ft
t
f
T
fa tuxFtxMVtxJ
0
,,?
dtxtuxfT,,? qRV?
dtxtuxHtxMVtx
ft
t
T
f
T
f
0
,,,
0?aJ?

tuxHx,,,?
正则方程

x
tuxH
,,,
边条与横截条件:
例 1,
0,,,?
u
tuxH?
00 xtx 0?ftxM

ftt
T
f V
x
xM
x
t?
txtx 21
tutxtx 22?
001?x
002?x
终端约束,求 的解:
dttuxxJ
2
0
22
2
2
1 2
122
2
152
2
1
15252 21 xx min?J *u
给定,终端约束
ft
uxufFH T 2221
2
1
2
1

ux
x
f
2
2
由于,
2221 22215221 xxtx f?
015252 21 xxM

Hx 21 xx uxx 22?
0
1
1

x
H
11 ct
12
2
2

x
H cect t 22?
又由
02
u
u
H 122 cecttu t
41231
2
1 ctcecectx tt
1232
2
1 cecectx tt
000 21 xx
f
ff
f tVtx
M
txt 111?


6.6 极小值原理( 受约束)
f
ff
f tVtx
M
tx
t
22
2?


73.01c 13.02c
tetu 3.175.0*
u
如果 (开集),且 对 连续可微变分法如果 (闭集),在 的边界上不任意极小值原理,1956年由前苏联学者庞特里亚金提出,它不要求 对 可微定理 1:对如下定常系统,终值型,
受约束。
u H u
u
u
0 uH
utuxf,,
J u
其中 为分段连续函数容许控制域,自由,固定或自由假设:,连续可微在有界集上,对 满足李卜希茨条件
ftxuJm i n
tu
..tsuxfx, 00 xtx?
ftftx
mn RtuRtx,
1uxf,x?
uxf,x2
则对 必存在非零 使下式成立。
2121,,xxauxfuxf 0a?
***,,ttxtu nRt
1

Htx?
x
H
正则方程
uxftuxH T,,,
2
00 xtx?

f
f txt?
边条、横条自由时:
例 1,
其中,若 自由,求 使
3
,,m i n,,*** uxHuxH?
u
4
ft 0,,,
****tuxH
tutxtx 11 101?x
txtx 12 002?x
m i n12 xJ
1?tuftxtu*
解:终端,
J 1?ft
12xtx f 1?ft
1 1 2 1 1 1 2 1 1,,H x u x u x x x u
0
2
2

x
H
21
1
1

x
H?
22 ct
211 cect t
由 可知:
1
1
10
1x

2
2
11
1x

11 ec 12?c
H


1
1
s g n 1*?tu
1 0
1 0
01 1?t 切换点
11 10tte
01?t? 1?t
[0,1 )t
定理 2,对如下定常系统,积分型,受约束,末端自由


0
1*
tu
[0,1)t
1?t
t
1?
1
t
1?
u
J u
ftx
1
则:
固定,则最优解的必要条件为:
正则方程:
dtuxFuJ
ft
t

0
,m i n
tu
..tsuxftx, 00 xtx?
ft
Htx x
Ht

uxftuxFuxH T,,,,
边条、横条:
极小值条件:
例:
试求,时的,
解:
定常系统、积分型,同定,自由,受约束
00 xtx 0?ft?
,,m i n,,*** uxHuxH?
u
tutxtx 50?x 15.0 tu
m in
1
0
dttutxJ
*u *x
uxuxuxH 11
J ft
ftx
u
由协态方程切换点:

5.0
1*
tu
1
1
1xHt
1 tcet 011 1ce
ec
1 1tte
10st 111 sts et?
3 0 7.0?st

5.0
1*
tu
0 0,3 0 7t
13 0 7.0 t

5.0
1
tx
tx
tx?
0 0,3 0 7t
13 0 7.0 t

5.0
1
2
1
t
t
ec
ec
tx
0 0,3 0 7t
13 0 7.0 t
由当 求出 时 的初态
50?x? 41?c
14* tetx 0 0,3 0 7t
13 0 7.0 ttx3 0 7.0?st
44.63 0 7.0?x? 37.42?c
5.037.4
14*
t
t
e
e
x
0 0,3 0 7t
13 0 7.0 t
t?
t
72.1
1
307.0 10
5.0
1
307.0 1 t
*u
0
tx*
t
1307.00
44.6
5
3.12