自适应控制
Adaptive Control
★, Cybernetics,or the Control and
Communication in the Animal
and the Machine,
★, Engineering Cybernetics,
控制论是关于工程技术领域各个系统自动控
制和自动调节的理论。维纳博士四十年代提
出了控制论的基本思想后,不少工程师和数
学博士曾寻找通往这座理论顶峰的道路,但
均半途而废。工程师偏重于实践,解决具体
问题,不善于上升到理论高度、数学家则擅
长理论分析,却不善于从一般到个别去解决
实际问题。钱学森则集中两个优势于一身,
高超地将两只轮子装到一辆战车上,碾出了
工程控制论研究的一条新途径。 ……
我们可以毫不含糊地说,从科学理论地角
度来看,20世纪上半叶的 三大伟绩 是 相对
论, 量子论 和 控制论,也许可以称它们为
三项科学革命,是人类认识客观世界的 三
大飞越 。
“勇气”号在火星工作的英姿
“勇气”号火星探测器前景动画
火星探测器登陆火星示意图
“嫦娥一号”卫星模拟图
“深度撞击”撞击器
人类首次“炮轰”彗星 ---坦普尔 1号彗星
自动控制理论的研究内容
◇ 经典控制理论
(传递函数,SISO,LTI)
◇ 现代控制理论
(状态空间,MIMO,时变)
H∞控制、最优控制、非线性系统控制、
自适应控制、分布参数控制、离散事件动
态系统等等
ASME 1985 Rufus Oldenburger
IFAC 1987 Giorgio Quazza
(American Society of Mechanical Engineers)
(International Federation of Automatic Control)
讲授内容
第一章 自适应控制以及其应用背景概述
第二章 实时估计( real-time estimation)
第三章 自校正调节器
( self-tuning regulators,STR)
第四章 模型参考自适应系统
( model-reference adaptive systems,MRAS)
第五章 自适应系统的特性
☆ 稳定性 stability
☆ 收敛性 convergence
☆ 鲁棒性 robustness
第六章 自动整定( auto-tuning)
第七章 增益调度( gain-scheduling)
第八章 鲁棒高增益( robust high-gain)控制
自振荡( self-oscillating)控制器
第九章 实现问题( implementation)
第十章 应用概况及展望
MATLAB系统仿真软件
例 1:线性代数问题的计算机求解
金庸作品 中经常提到的一个“数学问题”,
如何生成一个 3× 3矩阵,并将 1- 9分别置成
这个矩阵的 9个元素,使得每一行,每一列,
主、反对角线元素相加都相同。
魔方矩阵
? magic(3)
? ans =
? 8 1 6
? 3 5 7
? 4 9 2
九宫之义,法以灵龟,二四为肩,六八为足,
左三右七,戴九履一,五居中央
4 9 2
3 5 7
8 1 6
? magic(9)
? ans =
? 47 58 69 80 1 12 23 34 45
? 57 68 79 9 11 22 33 44 46
? 67 78 8 10 21 32 43 54 56
? 77 7 18 20 31 42 53 55 66
? 6 17 19 30 41 52 63 65 76
? 16 27 29 40 51 62 64 75 5
? 26 28 39 50 61 72 74 4 15
? 36 38 49 60 71 73 3 14 25
? 37 48 59 70 81 2 13 24 35
例 2:常微分方程的解
求解常微分方程是一般连续系统仿真的基础,
Lorenz方程是一个著名的混沌问题,其数学描
述如下,
?
?
?
?
?
????
???
???
)()(28)()()(
)(10)(10)(
)()(3/)(8)(
32213
322
3211
txtxtxtxtx
txtxtx
txtxtxtx
?
?
?
10321 10)0(,0)0()0( ???? xxx若令初始条件
function examp1
[t,y]=ode45(@lorenzeq,[0,100],[0;0;1e-10]);
plot3(y(:,1),y(:,2),y(:,3))
axis([10 42 -20 20 -20 28]);
function xdot = lorenzeq(t,x)
xdot=[-8/3*x(1)+x(2)*x(3);
-10*x(2)+10*x(3);
-x(1)*x(2)+28*x(2)-x(3)];
3、分形系统仿真 Mandelbrot图
第一章 自适应控制概述
( Introduction of Adaptive Control)
1.1 引言
自适应控制器, 能修正自己的特性以响应
过程和扰动的动力学特性的变化。
自适应,改变行为或习性以适应新的环境。
自适应控制与常规反馈控制的区别?
1973 基于自组织控制( self-organizing
control,SOC)系统,参数自适应 SOC,性能
自适应 SOC以及学习控制系统
1961 自适应系统是按照某种自适应观点
设计的任何一种物理系统。
一个有意义的自适应控制的定义应能着眼
于控制器的 硬件 和 软件,并且 能判断它是
否是自适应的 。
自适应控制器是 具有可调参数 以及 调整参
数机理 的控制器。
自适应控制发展简史
50年代 高性能飞机的自动驾驶仪
60年代 状态空间理论、稳定性理论,
随机控制理论( stochastic control theory ),
动态规划( dynamic programming),
系统 辨识( system identification)
Tsypkin
70年代末- 80年代初 稳定性证明
80年代 商业用途的自适应控制器
自适应控制的研究对象:具有某种不确定性
系统外部,扰动
系统内部,模型的结构和参数
自适应控制所要解决的问题,
面对客观存在的各式各样的不确定性,如何设
计适当的控制作用,使得某一指定的性能指标
达到并且保持或接近最优。
],),(),([)(
],),(),([)(
tθtutxhty
tθtutxftx
?
??
)()(),()(
)()(),()(),()1(
kvkxkθHky
kwkukθkxkθkx
??
??????
1、确定性最优控制问题
? 三个矩阵中的参数相量 是已知的 ; θ
? 是时间 k的确定性函数 ; )(),( kvkw
? 系统的初始条件也是已知的。
在已知对象模型和扰动模型的条件下,设计一个控
制序列,使某一指定的性能指标函数达到最小 ;
m in]),(),([
0
?? ?
?
N
k
kkukxCJ
2、随机最优控制问题
? 三个矩阵中的参数相量 是已知的 ; θ
? 是统计特性已知的随机序列 ; )(),( kvkw
? 系统的初始条件是统计特性已知的随机相量。
在已知对象模型和扰动模型的条件下,设计一
个控制序列,使得总代价的数学期望最小 ;
m i n]),(),([
0
?
?
?
?
?
?
?? ?
?
N
k
kkukxCEJ
3、自适应控制问题
? 三个矩阵中的参数相量 是未知的 ; θ
? 是统计特性未知的随机序列 ; )(),( kvkw
? 系统的初始条件是统计特性未知的随机相量。
在对象模型和扰动模型不完全确定的条件下,
设计一个控制序列,使得指定的性能指标尽可
能地接近和保持最优 ;
4、智能控制问题
不借助基于数学模型的方法,而是借助
人工智能学科,如专家系统 ;
1.2 线性反馈
1、鲁棒高增益控制
fbP
fbP
GG
GG
T
?
?
1
P
P
fbP G
dG
GGT
dT
?
?
?
1
1
01.0,0,01.0,))(1( 10 ????? aassG
例 1.1 不同的开环响应
例 1.2 相同的开环响应
03.0,015.0,0,)1)(20)(1( )1(4000 ???? ?? TTsss sTG
例 1.3 具有未知符号的积分器
s
kG P?
0
1.3 过程变化的机理及对系统性能的影响
非线性执行器( nonlinear actuator)
例 1.4 非线性阀( nonlinear valve)
流量和速度变化( flow and speed variations)
例 1.5 浓度控制( concentration control)
)(/
)]()()[(
)(
tqVτ
tcτtctq
dt
tdc
V
d
inm
?
???
)(/ tqVT m?
若令
1
)(0
?
?
?
Ts
e
sG
τs
飞行控制( flight control)
例 1.6 飞机的短期动力学特性
( short-period aircraft dynamics)
u
b
x
a
aaa
aaa
dt
dx
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
0
00
1
232221
131211
? ?eZT δθNx ??
扰动特性的变化
( variation in disturbance characteristics)
例 1.7 船舶驾驶( ship steering)
1.4 自适应方案( adaptive schemes)
1,增益调度( gain-scheduling)
2、模型参考自适应系统 MRAS
( model-reference adaptive system)
θ
eeγ
dt
θd
?
???
3、自校正调节器 STR
( self-tuning regulators )
确定性等价原理
( certainty equivalence principle)
4、对偶控制( dual control)
随机自适应控制
非线性随机控制理论
1.5 自适应控制问题
过程描述( process descriptions)
Cxy
BuAx
dt
dx
?
??
n
nn
m
mm
P asasa
bsbsbsG
???
????
?
?
?
?
1
10
1
10)(
)()(
)()()1(
tCxty
tutxtx
?
?????
n
nn
m
mm
P azaza
bzbzbzH
???
????
?
?
?
?
1
10
1
10)(
微分算子( differential operator)
前移算子( forward shift operator)
dtdp /?
)()()( tupGty ?
)()()( tuqHty ?
)1()( ?? tytqy
控制器结构( controller structure)
Lxu ??
)()()()()()( sUsTsYsSsUsR C???
?
?
?
?
?
?
?
?
0 if
0 if
vu
vu
u fc
例 1.9 状态反馈增益的调整
例 1.10 一般的控制器
例 1.11 摩擦补偿器( friction compensator)的调整
设计自适应控制器的步骤
▽ 描述闭环系统的期望特性
▽ 确定具有可调参数的合适控制律
▽ 找到调整参数的机理(机制)
▽ 实施控制律
1.6 应用
60年代初 —70年代初 探索试验阶段
70年代初 —80年代初 工业试验阶段
80年代以后 — 产品商业化阶段
哈勃望远镜指向控制
哈勃望远镜捕捉到“黑眼”星系照片
哈勃望远镜观察到神秘星体
工业自适应控制器
1981 美国 Leeds和 Northrup 自校正方案的 PID控制器
1982 瑞典 Asea Brown Boveri 通用自适应调节器
1984 瑞典 SattContro 小型 DDC包含 PID自动整定
1986 瑞典 SattContro 具有自动整定技术的单回路控制器
自适应控制的理论
? 稳定性
自适应控制系统的 稳定性 是指系统的状态,
输入、输出和参数等变量,在干扰的作用下,
应当总是有界的。
BIBO( bounded input bounded output)
稳定性理论是研究 MRAS的主要理论基础
大多数 MRAS在分析其稳定性时,都可以归结为
研究一个误差模型。这个误差模型由 一个线性系统
和 一个非线性反馈环节 所组成。
如果误差模型的线性部分的传递函数是 严格正实 的
SPR( strict positive real),而非线性部分是 无源
的( passive),则闭环系统是稳定的。
? 收敛性
一个自适应控制算法具有 收敛性 是指在给定的
初始条件下,算法能渐进地达到其预期目标,
并在收敛过程中保持系统的所有变量有界。
参数估计的递推算法
? 鲁棒性
自适应控制系统的 鲁棒性 是指在存在扰动和
未建模动态特性的条件下,系统能保持其稳
定性和一定的动态性能的能力。
80年代 Rohrs
Adaptive Control
★, Cybernetics,or the Control and
Communication in the Animal
and the Machine,
★, Engineering Cybernetics,
控制论是关于工程技术领域各个系统自动控
制和自动调节的理论。维纳博士四十年代提
出了控制论的基本思想后,不少工程师和数
学博士曾寻找通往这座理论顶峰的道路,但
均半途而废。工程师偏重于实践,解决具体
问题,不善于上升到理论高度、数学家则擅
长理论分析,却不善于从一般到个别去解决
实际问题。钱学森则集中两个优势于一身,
高超地将两只轮子装到一辆战车上,碾出了
工程控制论研究的一条新途径。 ……
我们可以毫不含糊地说,从科学理论地角
度来看,20世纪上半叶的 三大伟绩 是 相对
论, 量子论 和 控制论,也许可以称它们为
三项科学革命,是人类认识客观世界的 三
大飞越 。
“勇气”号在火星工作的英姿
“勇气”号火星探测器前景动画
火星探测器登陆火星示意图
“嫦娥一号”卫星模拟图
“深度撞击”撞击器
人类首次“炮轰”彗星 ---坦普尔 1号彗星
自动控制理论的研究内容
◇ 经典控制理论
(传递函数,SISO,LTI)
◇ 现代控制理论
(状态空间,MIMO,时变)
H∞控制、最优控制、非线性系统控制、
自适应控制、分布参数控制、离散事件动
态系统等等
ASME 1985 Rufus Oldenburger
IFAC 1987 Giorgio Quazza
(American Society of Mechanical Engineers)
(International Federation of Automatic Control)
讲授内容
第一章 自适应控制以及其应用背景概述
第二章 实时估计( real-time estimation)
第三章 自校正调节器
( self-tuning regulators,STR)
第四章 模型参考自适应系统
( model-reference adaptive systems,MRAS)
第五章 自适应系统的特性
☆ 稳定性 stability
☆ 收敛性 convergence
☆ 鲁棒性 robustness
第六章 自动整定( auto-tuning)
第七章 增益调度( gain-scheduling)
第八章 鲁棒高增益( robust high-gain)控制
自振荡( self-oscillating)控制器
第九章 实现问题( implementation)
第十章 应用概况及展望
MATLAB系统仿真软件
例 1:线性代数问题的计算机求解
金庸作品 中经常提到的一个“数学问题”,
如何生成一个 3× 3矩阵,并将 1- 9分别置成
这个矩阵的 9个元素,使得每一行,每一列,
主、反对角线元素相加都相同。
魔方矩阵
? magic(3)
? ans =
? 8 1 6
? 3 5 7
? 4 9 2
九宫之义,法以灵龟,二四为肩,六八为足,
左三右七,戴九履一,五居中央
4 9 2
3 5 7
8 1 6
? magic(9)
? ans =
? 47 58 69 80 1 12 23 34 45
? 57 68 79 9 11 22 33 44 46
? 67 78 8 10 21 32 43 54 56
? 77 7 18 20 31 42 53 55 66
? 6 17 19 30 41 52 63 65 76
? 16 27 29 40 51 62 64 75 5
? 26 28 39 50 61 72 74 4 15
? 36 38 49 60 71 73 3 14 25
? 37 48 59 70 81 2 13 24 35
例 2:常微分方程的解
求解常微分方程是一般连续系统仿真的基础,
Lorenz方程是一个著名的混沌问题,其数学描
述如下,
?
?
?
?
?
????
???
???
)()(28)()()(
)(10)(10)(
)()(3/)(8)(
32213
322
3211
txtxtxtxtx
txtxtx
txtxtxtx
?
?
?
10321 10)0(,0)0()0( ???? xxx若令初始条件
function examp1
[t,y]=ode45(@lorenzeq,[0,100],[0;0;1e-10]);
plot3(y(:,1),y(:,2),y(:,3))
axis([10 42 -20 20 -20 28]);
function xdot = lorenzeq(t,x)
xdot=[-8/3*x(1)+x(2)*x(3);
-10*x(2)+10*x(3);
-x(1)*x(2)+28*x(2)-x(3)];
3、分形系统仿真 Mandelbrot图
第一章 自适应控制概述
( Introduction of Adaptive Control)
1.1 引言
自适应控制器, 能修正自己的特性以响应
过程和扰动的动力学特性的变化。
自适应,改变行为或习性以适应新的环境。
自适应控制与常规反馈控制的区别?
1973 基于自组织控制( self-organizing
control,SOC)系统,参数自适应 SOC,性能
自适应 SOC以及学习控制系统
1961 自适应系统是按照某种自适应观点
设计的任何一种物理系统。
一个有意义的自适应控制的定义应能着眼
于控制器的 硬件 和 软件,并且 能判断它是
否是自适应的 。
自适应控制器是 具有可调参数 以及 调整参
数机理 的控制器。
自适应控制发展简史
50年代 高性能飞机的自动驾驶仪
60年代 状态空间理论、稳定性理论,
随机控制理论( stochastic control theory ),
动态规划( dynamic programming),
系统 辨识( system identification)
Tsypkin
70年代末- 80年代初 稳定性证明
80年代 商业用途的自适应控制器
自适应控制的研究对象:具有某种不确定性
系统外部,扰动
系统内部,模型的结构和参数
自适应控制所要解决的问题,
面对客观存在的各式各样的不确定性,如何设
计适当的控制作用,使得某一指定的性能指标
达到并且保持或接近最优。
],),(),([)(
],),(),([)(
tθtutxhty
tθtutxftx
?
??
)()(),()(
)()(),()(),()1(
kvkxkθHky
kwkukθkxkθkx
??
??????
1、确定性最优控制问题
? 三个矩阵中的参数相量 是已知的 ; θ
? 是时间 k的确定性函数 ; )(),( kvkw
? 系统的初始条件也是已知的。
在已知对象模型和扰动模型的条件下,设计一个控
制序列,使某一指定的性能指标函数达到最小 ;
m in]),(),([
0
?? ?
?
N
k
kkukxCJ
2、随机最优控制问题
? 三个矩阵中的参数相量 是已知的 ; θ
? 是统计特性已知的随机序列 ; )(),( kvkw
? 系统的初始条件是统计特性已知的随机相量。
在已知对象模型和扰动模型的条件下,设计一
个控制序列,使得总代价的数学期望最小 ;
m i n]),(),([
0
?
?
?
?
?
?
?? ?
?
N
k
kkukxCEJ
3、自适应控制问题
? 三个矩阵中的参数相量 是未知的 ; θ
? 是统计特性未知的随机序列 ; )(),( kvkw
? 系统的初始条件是统计特性未知的随机相量。
在对象模型和扰动模型不完全确定的条件下,
设计一个控制序列,使得指定的性能指标尽可
能地接近和保持最优 ;
4、智能控制问题
不借助基于数学模型的方法,而是借助
人工智能学科,如专家系统 ;
1.2 线性反馈
1、鲁棒高增益控制
fbP
fbP
GG
GG
T
?
?
1
P
P
fbP G
dG
GGT
dT
?
?
?
1
1
01.0,0,01.0,))(1( 10 ????? aassG
例 1.1 不同的开环响应
例 1.2 相同的开环响应
03.0,015.0,0,)1)(20)(1( )1(4000 ???? ?? TTsss sTG
例 1.3 具有未知符号的积分器
s
kG P?
0
1.3 过程变化的机理及对系统性能的影响
非线性执行器( nonlinear actuator)
例 1.4 非线性阀( nonlinear valve)
流量和速度变化( flow and speed variations)
例 1.5 浓度控制( concentration control)
)(/
)]()()[(
)(
tqVτ
tcτtctq
dt
tdc
V
d
inm
?
???
)(/ tqVT m?
若令
1
)(0
?
?
?
Ts
e
sG
τs
飞行控制( flight control)
例 1.6 飞机的短期动力学特性
( short-period aircraft dynamics)
u
b
x
a
aaa
aaa
dt
dx
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
0
0
00
1
232221
131211
? ?eZT δθNx ??
扰动特性的变化
( variation in disturbance characteristics)
例 1.7 船舶驾驶( ship steering)
1.4 自适应方案( adaptive schemes)
1,增益调度( gain-scheduling)
2、模型参考自适应系统 MRAS
( model-reference adaptive system)
θ
eeγ
dt
θd
?
???
3、自校正调节器 STR
( self-tuning regulators )
确定性等价原理
( certainty equivalence principle)
4、对偶控制( dual control)
随机自适应控制
非线性随机控制理论
1.5 自适应控制问题
过程描述( process descriptions)
Cxy
BuAx
dt
dx
?
??
n
nn
m
mm
P asasa
bsbsbsG
???
????
?
?
?
?
1
10
1
10)(
)()(
)()()1(
tCxty
tutxtx
?
?????
n
nn
m
mm
P azaza
bzbzbzH
???
????
?
?
?
?
1
10
1
10)(
微分算子( differential operator)
前移算子( forward shift operator)
dtdp /?
)()()( tupGty ?
)()()( tuqHty ?
)1()( ?? tytqy
控制器结构( controller structure)
Lxu ??
)()()()()()( sUsTsYsSsUsR C???
?
?
?
?
?
?
?
?
0 if
0 if
vu
vu
u fc
例 1.9 状态反馈增益的调整
例 1.10 一般的控制器
例 1.11 摩擦补偿器( friction compensator)的调整
设计自适应控制器的步骤
▽ 描述闭环系统的期望特性
▽ 确定具有可调参数的合适控制律
▽ 找到调整参数的机理(机制)
▽ 实施控制律
1.6 应用
60年代初 —70年代初 探索试验阶段
70年代初 —80年代初 工业试验阶段
80年代以后 — 产品商业化阶段
哈勃望远镜指向控制
哈勃望远镜捕捉到“黑眼”星系照片
哈勃望远镜观察到神秘星体
工业自适应控制器
1981 美国 Leeds和 Northrup 自校正方案的 PID控制器
1982 瑞典 Asea Brown Boveri 通用自适应调节器
1984 瑞典 SattContro 小型 DDC包含 PID自动整定
1986 瑞典 SattContro 具有自动整定技术的单回路控制器
自适应控制的理论
? 稳定性
自适应控制系统的 稳定性 是指系统的状态,
输入、输出和参数等变量,在干扰的作用下,
应当总是有界的。
BIBO( bounded input bounded output)
稳定性理论是研究 MRAS的主要理论基础
大多数 MRAS在分析其稳定性时,都可以归结为
研究一个误差模型。这个误差模型由 一个线性系统
和 一个非线性反馈环节 所组成。
如果误差模型的线性部分的传递函数是 严格正实 的
SPR( strict positive real),而非线性部分是 无源
的( passive),则闭环系统是稳定的。
? 收敛性
一个自适应控制算法具有 收敛性 是指在给定的
初始条件下,算法能渐进地达到其预期目标,
并在收敛过程中保持系统的所有变量有界。
参数估计的递推算法
? 鲁棒性
自适应控制系统的 鲁棒性 是指在存在扰动和
未建模动态特性的条件下,系统能保持其稳
定性和一定的动态性能的能力。
80年代 Rohrs