5.7 线性二次型最优控制问题一,最优控制问题的一般提法
(1)给出系统的状态方程
(2)给出控制量 的限制条件
(3)明确始端条件,
给定,固定始端的控制问题 ;
固定,任意,自由始端的控制问题,
(4)明确终端条件,类似于始端条件
(5)给出性能指标任务,寻求一个最优控制,使系统的状态轨线从初态 出发到达,且沿此轨线,性能指标最小,即
),( uxfx
u
)](,[ 00 txt
0t )( 0tx
fttf dtttutxLtxJ 0 ]),(),([)]([?
)(tu? )(tx?
)( 0tx )( ftx
))((m in))(( )( tuJtuJ tu
分类,对 u(t)无约束 -------泛函求极值问题,变分法对 u(t)有约束 -------庞特里亚金极大值原理,动态规划离散系统本课程:
线性系统
LQ问题,二次型性能指标求 使
],0[,)0(,0 fttxxBuAxx
对称矩阵正定对称矩阵半正定
,:
,:,
)]()()()([
2
1
)()(
2
1
0
R
QS
dttRututQxtxtSxtxJ
ft
t
TT
ff
T
)(tu? ))((m in))((
)( tuJtuJ tu?
二,有限时间 LQ调节问题调节问题:受外部动态扰动时,保持 x(t)回到零平衡态;
有限时间,为有限值;
LQ问题:二次型性能指标。
定理:系统使性能指标为最小的输入,可由下面的状态反馈解给出其中
P(t)为满足终端条件 的矩阵 Riccati微分方程的正半定对称解阵
ft
],0[,)0(,0 fttxxBuAxx
ftt TTffT dttRututQxtxtSxtxJ 0 )]()()()([21)()(21
)()()( 1 txtPBRtu T
StP f?)(
)()()()()( 1 tPBBRtPQtPAAtPtP TT
此时,性能指标 J的最小值为证明:该定理给出的是充分条件,实际上也是必要条件。
0,)0(21 000m i n xxPxJ T
f
f
f
f
f
t
TTTTT
t
TTTTTT
t
TTTTT
t
TT
T
T
t
T
fff
T
dtxtPBRuRxtPBRuRuuQxx
dtButPxxtPBuxtPBBRtPxQxx
dtButPxxtPBuxAtPtPtPAx
dtxtPxxtPxxtPx
dtxtPx
dt
d
xPxtxtPtx
0
11
0
1
0
0
0
]})([])([{
2
1
})()()()({
2
1
})()(])()()([{
2
1
])()()([
2
1
])([
2
1
)0()0()0(
2
1
)()()(
2
1
)0()0()0(
2
1
))((
)()()(
])([])([
2
1
)0()0()0(
2
1
][
2
1
)()()(
2
1
1
0
11
0
xPxuJJ
txtPBRtu
dtxtPBRuRxtPBRuxPx
dtRuuQxxtxtPtxJ
T
T
t
TTTT
t
TT
fff
T
f
f
可见
综上,有限调节时间 LQ问题的综合步骤是:
(1)A,B,P(tf)=S,Q,R代入 Riccati非线性矩阵微分方程,解出增益矩阵 P(t);
(2)构造状态反馈此时闭环状态方程为 )()()( 1 txtPBRtu T
0
1
)0(
,)]([
xx
xtPBBRAx T
A
CB
)(1 tPBR T?
u x y
-
注意:
--有限时间 LQ调节问题的最优调节系统是状态反馈系统,
反馈矩阵是唯一的。
--对象系统虽然是定常的,但闭环系统却是时变的。
-- Riccati矩阵微分方程是非线性微分方程,难求解析解,可离散计算。
--前述的定理也适用时变线性系统。
二,无限时间 LQ调节问题的最优解提法,线性系统性能指标
0)0(,xxBuAxx
无约束对称矩阵正定 )(;,:,
)]()()()([
2
1
0
tuRQ
dttRututQxtxJ TT?
寻求最优控制,使初态转移到0,且J最小。
无限时间调节问题与有限时间调节问题提法上的区别:
(1)此处对象为线性定常系统;
(2)不考虑终端指标;
(3){A,B}可控。
无限调节时间调节器可以看作是终端指标为0,终端时间趋于无穷,受控系统是定常可控的有限调节时间调节器问题。
Kalman指出,此时矩阵微分方程的解 P(t),当时,P(t)的极限存在且唯一,即常阵P即为无限调节时间调节器的增益矩阵。
ft
PtPt )(l i m
求解P的问题变为求解 Riccati代数矩阵方程的正定解。 P正定(比较有限调节时间时 P(t)半正定)
一旦求得 P,即可得到闭环系统为仍保持为定常系统。
对 P的要求:最优系统必须是稳定的,即的所有特征值均具负实部。
可以证明:以上方法构成的最优闭环系统必是大范围渐近稳定的。
01 PBP B RQPAPA TT
)()( 1 tPxBRtu T
xPBBRAx T ][ 1
][ 1 PBBRA T
证明:
选取 Lyapunov函数如果 Q正定放宽为 Q半正定,则,只要 {A,H}能观,则仍能保证闭环系统渐近稳定。
闭环系统全局渐近 稳定
)(lim
0)(
)(
)(
)(
||||
1
1
xV
xPBPBRQx
xPxPxxxV
xPBBRAx
PxxxV
x
TT
T
T
T
T
HHQ T?
例
)()12()()(
12
01
0
:
)(
2
1
1
2
1
0
22
txtPxBRtu
P
PPP
PBP B RQPAPA
u
dtuxJ
uxx
T
TT
解求
5.8状态重构问题和状态观测器一,状态重构问题系统的实际状态不可得。
重构状态:构造一系统,利用原系统可直接量测的变量 u和 y作输入,产生输出,使该人为构造的系统称为观测器。
状态观测器:全维,降维函数观测器:重构状态的函数,如
)(?tx
)(l i m)(?l i m txtx tt
)(l i m)(l i m),( tkxtwtkx tt
二,全维状态观测器观测器的维数和受控系统的维数相同。
对象:
方法 I:(本科已学过)要求 {A,C}能观测。
构造和原系统相同的系统,在初值 时,
通过 之差调整,使方法 II:受控系统能控,能观全维状态观测器可取为在 F,G,H,T满足一定条件时,可作为原系统的观测器。
Cxy
txxBuAxx
0,)0(,0
)0()0(? xx?
)(?)( tyty 和 )(l i m)(?l i m txtx
tt
zTx
zzHuGyFzz
1
0
)0(,
结论 1,任意,上述系统是 {A,B,C}的全维状态观测器的充要条件是:
证明:
充分性:
满足 (1)(2)(3),则
z(t)是 Tx的估计,
uzx,,00
均具负实部非奇异
niF
TBH
TGCFTTA
i,,2,1),()3(
)2(
,)1(
Fe
uTBHG C xT A xF T xF T xFz
BuAxTHuGyFz
xTze
Txze
)(
)(
则定义
tte,0)(
xzTxzT?,11 即的估计是必要性:见课本的说明。
实际设计中,F,G可选,由 (1)求出 T要非奇异。 H可由 (2)算出。
关键是要能从 TA-FT=GC求出非奇异的 T。
结论 2:设 A和 F无公共特征值则条件 (1) TA-FT=GC存在非奇异解 T的充分必要条件是 {A,C}能观,{F,G}可控。
( SISO时也是充分条件)
证明略。
算法:
.21,;,:4
,:3
},{,:2
)()(,0)(,:1
s te ps te pTTBHTs te p
TGCFTTAs te p
GFGs te p
AFFFs te p
qn
iiinn
或返回奇异若则非奇若求出唯一解阵求解能控使选取且使选取
三,降维状态观测器线性定常系统
y中已包含 x的信息,y可量测出,故可构造维数低于状态维数的观测器,即降维观测器。最小维数为 (n-q).
方法 I:
思路,利用相似变换,先从 y和 u中提取出已知 x的信息,
再对剩下的状态变量构造全维状态观测器。
已知条件,{A,B,C},rankC=q,{A,C}能观
step1:构造
qr a n k C
Cxy
txxBuAxx
输出的维数?
0,)0(,0
][
,
)(** 21
1
)*(
*
*
qnnqn
QQPQ
PR
R
C
P
nqn
nq
nn
非奇异选得使
step2:作线性非奇异变换,
qnq
qn
q
IRQRQCQICQ
I
I
RQRQ
CQCQ
QQ
R
C
PQ
2121
21
21
21
,0,0,
0
0
][
Pxx?
qn
q
x
x
x
xIxCQCQxCPy
uBxAP B uxP A Px
q
2
1
21
1
1
]0[][
记则上式写成
.,,)(
.,,,
0
22
2
1
2
1
2
1
2
1
2221
1211
2
1
是全维状态观测器而言对维状态观测器构造只需对可得已知则只需再估计出因此
xqnx
xxx
x
x
x
Iy
u
B
B
x
x
AA
AA
x
x
q
能观能观得的状态方程和输出方程写出关于
},{},{
1222
212
222
2
2121111212111
1
221222
2
2222121
2
2
AACA
xAw
uxAx
xAuByAyuBxAxAx
uByAxAxuBxAxAx
x
w
u
Step3:
Step4:对以上系统构造全维状态观测器(第一种全维观测器的构造方法)
yLzx
z
uBLB
yALALALAzALAz
yLxz
y
uByAuByAyLxALAx
ALAL
uwLxALAx
2
12
112112221222
2
22111121222
2
1222
21222
2
,
)(
)]()[()(
.,
)()(
)(
)(
)(
重构通过此则设增加抗扰动性设法消去的全部特征值可以任意配置通过选取
Step5:
)(
2121
2
1
yLzQyQxQQx
yLz
y
x
x
x
结构图见书 P204页。
方法 II:对方法 I中的 Z来讲构造全维状态观测器(方法 II结论 1方法)
已知条件相同,取也可以用方法 II结论 2的方法估计 Z。
HuGyFzz
z
yQQ
z
y
T
Cx
21
1
5.9引入观测器的状态反馈控制系统的特性
闭环系统的维数提高了
分离原理:观测器和反馈控制器可分别设计,互不影响
系统的传递函数不变:观测器不影响闭环系统的传递函数
系统鲁棒性变差
等价于包含补偿器的输出反馈系统作业,5.16,5.18,5.19,5.24
(1)给出系统的状态方程
(2)给出控制量 的限制条件
(3)明确始端条件,
给定,固定始端的控制问题 ;
固定,任意,自由始端的控制问题,
(4)明确终端条件,类似于始端条件
(5)给出性能指标任务,寻求一个最优控制,使系统的状态轨线从初态 出发到达,且沿此轨线,性能指标最小,即
),( uxfx
u
)](,[ 00 txt
0t )( 0tx
fttf dtttutxLtxJ 0 ]),(),([)]([?
)(tu? )(tx?
)( 0tx )( ftx
))((m in))(( )( tuJtuJ tu
分类,对 u(t)无约束 -------泛函求极值问题,变分法对 u(t)有约束 -------庞特里亚金极大值原理,动态规划离散系统本课程:
线性系统
LQ问题,二次型性能指标求 使
],0[,)0(,0 fttxxBuAxx
对称矩阵正定对称矩阵半正定
,:
,:,
)]()()()([
2
1
)()(
2
1
0
R
QS
dttRututQxtxtSxtxJ
ft
t
TT
ff
T
)(tu? ))((m in))((
)( tuJtuJ tu?
二,有限时间 LQ调节问题调节问题:受外部动态扰动时,保持 x(t)回到零平衡态;
有限时间,为有限值;
LQ问题:二次型性能指标。
定理:系统使性能指标为最小的输入,可由下面的状态反馈解给出其中
P(t)为满足终端条件 的矩阵 Riccati微分方程的正半定对称解阵
ft
],0[,)0(,0 fttxxBuAxx
ftt TTffT dttRututQxtxtSxtxJ 0 )]()()()([21)()(21
)()()( 1 txtPBRtu T
StP f?)(
)()()()()( 1 tPBBRtPQtPAAtPtP TT
此时,性能指标 J的最小值为证明:该定理给出的是充分条件,实际上也是必要条件。
0,)0(21 000m i n xxPxJ T
f
f
f
f
f
t
TTTTT
t
TTTTTT
t
TTTTT
t
TT
T
T
t
T
fff
T
dtxtPBRuRxtPBRuRuuQxx
dtButPxxtPBuxtPBBRtPxQxx
dtButPxxtPBuxAtPtPtPAx
dtxtPxxtPxxtPx
dtxtPx
dt
d
xPxtxtPtx
0
11
0
1
0
0
0
]})([])([{
2
1
})()()()({
2
1
})()(])()()([{
2
1
])()()([
2
1
])([
2
1
)0()0()0(
2
1
)()()(
2
1
)0()0()0(
2
1
))((
)()()(
])([])([
2
1
)0()0()0(
2
1
][
2
1
)()()(
2
1
1
0
11
0
xPxuJJ
txtPBRtu
dtxtPBRuRxtPBRuxPx
dtRuuQxxtxtPtxJ
T
T
t
TTTT
t
TT
fff
T
f
f
可见
综上,有限调节时间 LQ问题的综合步骤是:
(1)A,B,P(tf)=S,Q,R代入 Riccati非线性矩阵微分方程,解出增益矩阵 P(t);
(2)构造状态反馈此时闭环状态方程为 )()()( 1 txtPBRtu T
0
1
)0(
,)]([
xx
xtPBBRAx T
A
CB
)(1 tPBR T?
u x y
-
注意:
--有限时间 LQ调节问题的最优调节系统是状态反馈系统,
反馈矩阵是唯一的。
--对象系统虽然是定常的,但闭环系统却是时变的。
-- Riccati矩阵微分方程是非线性微分方程,难求解析解,可离散计算。
--前述的定理也适用时变线性系统。
二,无限时间 LQ调节问题的最优解提法,线性系统性能指标
0)0(,xxBuAxx
无约束对称矩阵正定 )(;,:,
)]()()()([
2
1
0
tuRQ
dttRututQxtxJ TT?
寻求最优控制,使初态转移到0,且J最小。
无限时间调节问题与有限时间调节问题提法上的区别:
(1)此处对象为线性定常系统;
(2)不考虑终端指标;
(3){A,B}可控。
无限调节时间调节器可以看作是终端指标为0,终端时间趋于无穷,受控系统是定常可控的有限调节时间调节器问题。
Kalman指出,此时矩阵微分方程的解 P(t),当时,P(t)的极限存在且唯一,即常阵P即为无限调节时间调节器的增益矩阵。
ft
PtPt )(l i m
求解P的问题变为求解 Riccati代数矩阵方程的正定解。 P正定(比较有限调节时间时 P(t)半正定)
一旦求得 P,即可得到闭环系统为仍保持为定常系统。
对 P的要求:最优系统必须是稳定的,即的所有特征值均具负实部。
可以证明:以上方法构成的最优闭环系统必是大范围渐近稳定的。
01 PBP B RQPAPA TT
)()( 1 tPxBRtu T
xPBBRAx T ][ 1
][ 1 PBBRA T
证明:
选取 Lyapunov函数如果 Q正定放宽为 Q半正定,则,只要 {A,H}能观,则仍能保证闭环系统渐近稳定。
闭环系统全局渐近 稳定
)(lim
0)(
)(
)(
)(
||||
1
1
xV
xPBPBRQx
xPxPxxxV
xPBBRAx
PxxxV
x
TT
T
T
T
T
HHQ T?
例
)()12()()(
12
01
0
:
)(
2
1
1
2
1
0
22
txtPxBRtu
P
PPP
PBP B RQPAPA
u
dtuxJ
uxx
T
TT
解求
5.8状态重构问题和状态观测器一,状态重构问题系统的实际状态不可得。
重构状态:构造一系统,利用原系统可直接量测的变量 u和 y作输入,产生输出,使该人为构造的系统称为观测器。
状态观测器:全维,降维函数观测器:重构状态的函数,如
)(?tx
)(l i m)(?l i m txtx tt
)(l i m)(l i m),( tkxtwtkx tt
二,全维状态观测器观测器的维数和受控系统的维数相同。
对象:
方法 I:(本科已学过)要求 {A,C}能观测。
构造和原系统相同的系统,在初值 时,
通过 之差调整,使方法 II:受控系统能控,能观全维状态观测器可取为在 F,G,H,T满足一定条件时,可作为原系统的观测器。
Cxy
txxBuAxx
0,)0(,0
)0()0(? xx?
)(?)( tyty 和 )(l i m)(?l i m txtx
tt
zTx
zzHuGyFzz
1
0
)0(,
结论 1,任意,上述系统是 {A,B,C}的全维状态观测器的充要条件是:
证明:
充分性:
满足 (1)(2)(3),则
z(t)是 Tx的估计,
uzx,,00
均具负实部非奇异
niF
TBH
TGCFTTA
i,,2,1),()3(
)2(
,)1(
Fe
uTBHG C xT A xF T xF T xFz
BuAxTHuGyFz
xTze
Txze
)(
)(
则定义
tte,0)(
xzTxzT?,11 即的估计是必要性:见课本的说明。
实际设计中,F,G可选,由 (1)求出 T要非奇异。 H可由 (2)算出。
关键是要能从 TA-FT=GC求出非奇异的 T。
结论 2:设 A和 F无公共特征值则条件 (1) TA-FT=GC存在非奇异解 T的充分必要条件是 {A,C}能观,{F,G}可控。
( SISO时也是充分条件)
证明略。
算法:
.21,;,:4
,:3
},{,:2
)()(,0)(,:1
s te ps te pTTBHTs te p
TGCFTTAs te p
GFGs te p
AFFFs te p
qn
iiinn
或返回奇异若则非奇若求出唯一解阵求解能控使选取且使选取
三,降维状态观测器线性定常系统
y中已包含 x的信息,y可量测出,故可构造维数低于状态维数的观测器,即降维观测器。最小维数为 (n-q).
方法 I:
思路,利用相似变换,先从 y和 u中提取出已知 x的信息,
再对剩下的状态变量构造全维状态观测器。
已知条件,{A,B,C},rankC=q,{A,C}能观
step1:构造
qr a n k C
Cxy
txxBuAxx
输出的维数?
0,)0(,0
][
,
)(** 21
1
)*(
*
*
qnnqn
QQPQ
PR
R
C
P
nqn
nq
nn
非奇异选得使
step2:作线性非奇异变换,
qnq
qn
q
IRQRQCQICQ
I
I
RQRQ
CQCQ
R
C
PQ
2121
21
21
21
,0,0,
0
0
][
Pxx?
qn
q
x
x
x
xIxCQCQxCPy
uBxAP B uxP A Px
q
2
1
21
1
1
]0[][
记则上式写成
.,,)(
.,,,
0
22
2
1
2
1
2
1
2
1
2221
1211
2
1
是全维状态观测器而言对维状态观测器构造只需对可得已知则只需再估计出因此
xqnx
xxx
x
x
x
Iy
u
B
B
x
x
AA
AA
x
x
q
能观能观得的状态方程和输出方程写出关于
},{},{
1222
212
222
2
2121111212111
1
221222
2
2222121
2
2
AACA
xAw
uxAx
xAuByAyuBxAxAx
uByAxAxuBxAxAx
x
w
u
Step3:
Step4:对以上系统构造全维状态观测器(第一种全维观测器的构造方法)
yLzx
z
uBLB
yALALALAzALAz
yLxz
y
uByAuByAyLxALAx
ALAL
uwLxALAx
2
12
112112221222
2
22111121222
2
1222
21222
2
,
)(
)]()[()(
.,
)()(
)(
)(
)(
重构通过此则设增加抗扰动性设法消去的全部特征值可以任意配置通过选取
Step5:
)(
2121
2
1
yLzQyQxQQx
yLz
y
x
x
x
结构图见书 P204页。
方法 II:对方法 I中的 Z来讲构造全维状态观测器(方法 II结论 1方法)
已知条件相同,取也可以用方法 II结论 2的方法估计 Z。
HuGyFzz
z
yQQ
z
y
T
Cx
21
1
5.9引入观测器的状态反馈控制系统的特性
闭环系统的维数提高了
分离原理:观测器和反馈控制器可分别设计,互不影响
系统的传递函数不变:观测器不影响闭环系统的传递函数
系统鲁棒性变差
等价于包含补偿器的输出反馈系统作业,5.16,5.18,5.19,5.24