希望建立的模型尽善尽美:
能,逼真” 地模拟现实系统;
能,精确” 地预测系统的未来情况;
能,准确” 地控制系统;
得到问题的,最优” 解 ; …
逼真、精确、准确、最优,…
良好
愿望
数学模型是对现实世界的理想化,
不可能是真实世界的再现
任何数学模型在建立和使用的过程中,
不可避免的产生模型误差,
如:附加进数据测量误差,舍入误差和截断误差
等,
有必要对模型误差进行分析,并给出估计,
常用“绝对误差”和“相对误差”来衡量误差的
大小程度:
绝对误差 =测量值-近似值
相对误差 =绝对误差 /测量值
与数
量级
有关
例 6.4.1 用经验公式
0,
0 0 7 3.00 2 3 2 4.0
1 ?
?
? ? x
e
y x
作为土豆产量的近似估计公式,其误差数值
列表如下 (参见 p168表 7.6)
0.001
0.06
41.20
196
0.062
2.56
38.48
98
- 0.06
- 2.03
34.50
24
0.06相对误差
1.96绝对误差
31.5
0 施肥量
iy?
ii yy ??
iii yyy /)?( ?
问题 如何评价误差数据?
二.误差分析
各
类
误
差
数据测量误差
截断误差
模型假设误差
1,数据测量误差
* 在建立模型之前应该尽量控制实验数据的
质量,使之测量准确可靠,
* 数据带有无法消除的测量误差时,应分析
它对模型造成的影响,并对模型误差进行估计,
例 6.4.2 有高为 100厘米的半球形容器中装满
了水。从某一时刻开始,水从底部一个横截
面积为 1平方厘米的小孔流出,可以随时测出
水面高度 h。由水力学知,水从孔口流出的流
量(即通过孔口横截面的水的体积 V对时间 t
的变化率 )Q,有关系式
ghShQQ 262.0)( ??
其中 0.62为流量系数,S 是小孔口横截面积,
g 为重力加速度,
由测出的水面高度 h,可算得水流量,由于仪
器所限,测出的高度值有 ± 0.1厘米的误差,这
会引起水流量 Q的多大误差?
100h
水面高
度 h有误
差 Δh
分析 水面高度误差为 Δh,水流量误差则为
ghhhg 262.0)(262.0 ????
)()(0 hQhhQ ?????
)(262.0 hhhg ????
在 h=50厘米处,代入 Δh=0.1厘米,可算得绝 对
误差为
)/(93.1)501.50(980262.0 秒立方厘米???
相对误差为
11
262.0
)(262.0
?
?
??
???
?
?
h
h
hg
hhhg
Q
Q
在 h=50 厘米处的相对误差为
0 0 0 9 9 5.01
50
1.01 ???
约为 1‰,
2,截断误差
截断误差的来源:
1,用数值方法近似求解会产生截断误差;
2,函数近似产生截断误差;
3,计算机运算的精度误差;
应分析截断误差对模型的影响
例 6.4.3 广义生日问题
一个班有 30名学生,他们中至少有两名同一
天生日的概率 p=?
他们生日均不同日的概率为
,
365 30
30
3 6 5Pq ?
则 p =1- q.
一般化后,考虑下问题:
xn
x
nxxxxnf
n ??
????? 1,)1()2)(1()( ?
求最小的整数 n,使 f(n)≤q (给定 )
对于给定的 x,f(n)是单调下降函数 (序列 ),
解,可采用求根方法 — 对分法
q
当 q=0.5时,对不同的 x,可以算出 n 的最小值 n*,
见表 (P170表 7.7)的前两列,
建立满足 f(n)≤q 的最小值 n* 与 x 之间的关系式,
方法一(最小二乘法) 建立经验公式为
xn 1 7 9 0 5.15 7 2 8 0.0 ??
方法二 泰勒近似
xn
x
nxxxxnf
n ??
????? 1,)1()2)(1()( ?
将
改写为
)11()21)(11()( xnxxnf ????? ?
?? ?????????
!
)1(
!3!2
1
32
n
xxxxe nnx因
利用近似式
)()(
)1(21
ngeeenf x
n
xx ??
?????
?
令 g(n)=q,解出
n2- n+2x lnq=0,
方程的正根为
当 q=0.5,建立泰勒 近似公式为
xqn )( l n225.05.0 ???
n=0.5+ x3 8 6 2 9.125.0 ?
练习 对两种近似求解方法,计算各个近似值的
绝对误差和相对误差,
泰勒 近似式的误差控制函数
1,,2,1,1 ?????
?
nkR
x
kx
k
e k ?
因
其中;1,,2,1,)(210 2 ???? nkxkR k ?
),()1()1(/)(
1
1
1
1
1
1
nf
x
kR
x
kxkeng n
k
n
k
k
n
k
???????? ???
?
?
?
?
?
?
注意到 f(n)和 g(n)都是单调下降函数,选择 n*使
g(n*) ≥ q≥ g(n*+1) ≥f(n*+1),
又若 f(n*)≥q,则 n*或 n*+ 1就是整数 n满足
f(n)< q的最小值,
g(n)
f(n)
q
n* n*+1
若 f( n*)= q f(n)≤q,当 n≥n*;
若 f(n*)> q 当 n≥n*+1.
f (n*)> q≥ g(n*+1) ≥f(n*+1)≥f(n),
对最小值 n*点有
)1()()()(0 ????? ???? ngngnfng
??
?
?
?
?
??? ????
*
1
/
1
1
/)()(0
n
k
xk
n
k
xk eenfng
?
?
?
?? ??
1
1
/*/
*
)1(
n
k
xnxk ee
即
3,模型假设误差
通过对数据进行分析可以判断假设是否合理,
)(1
*
/*
x
nre xn ??? ?
是用 g(n)代换 f(n)的误差控制函数,比值越
接近于零,误差越小,
续例 6.1.3 施肥效果分析
有人做了如下两条假设:
*1 在实验中除施肥量,其他影响因子,如环境
条件,种植密度,土壤肥力等,均处于同等水平;
*2 各次实验独立,误差项 ε均服从 N(0,σ2).
分析, 从数据可见在实验点
)3 7 2,1 9 6,2 5 9(),,( 000 ?kpn
实际重复了三次试验,
第七
试验
水平问题,三次试验的土豆产量分别为
43.15,41.26,38.43( 单位, t/ha)
按照假设这 3 次重复试验产生的产量波动完
全因随机误差所致,
如何 解释 这 3个数据的波动?
并且土豆产量满足回归方程 合理
吗
?
分析,由 3 个数据计算得
,)ha/t(95.40? ?? y? )(38.2? 样本标准差??
95.0}3)({ ??? ?YEYP有概率式
),(~),,( 2?????? NkpnY
30个试验数据绝大多数落在区间 (33.82,48.07)
之内
由施肥水平变化所引起的土豆产量的变
动幅度不及随机误差产生的波动幅度大,
不
合
理
不合理的原因:
实际上三 次重复试验带有系统误差
主要来源于土壤肥力,生长
期的管理措施等多种试验
时的外界条件变化,
试验设计中,把在试验实施过程中外界环境
条件的差异所造的系统偏差称为 区组效应,
施肥问题中,对应于每种营养素的 10个施肥
试验点,应并为一个区组,
可认为区组内 10次试验的试验条件较为一致,
而不同区组间的试验条件差别较大,
根据有区组效应的数据不可能分析出各个肥
素对土豆产量的 交互作用,
利用数据建立模型
应尽量消除区组效应
通过试验设计,
保证数据质量,