6.4 模型误差分析一.模型误差的客观存在性希望建立的模型尽善尽美:
能,逼真” 地模拟现实系统;
能,精确” 地预测系统的未来情况;
能,准确” 地控制系统;
得到问题的,最优” 解 ; …
逼真、精确、准确、最优,…
良好愿望数学模型是对现实世界的理想化,
不可能是真实世界的再现任何数学模型在建立和使用的过程中,
不可避免的产生模型误差,
如:附加进数据测量误差,舍入误差和截断误差等,
有必要对模型误差进行分析,并给出估计,
常用“绝对误差”和“相对误差”来衡量误差的大小程度:
绝对误差 =测量值-近似值相对误差 =绝对误差 /测量值 与数量级有关例 6.4.1 用经验公式
0,
0 0 7 3.00 2 3 2 4.0
1?
x
e
y x
作为土豆产量的近似估计公式,其误差数值列表如下 (参见 p168表 7.6)
0.001
0.06
41.20
196
0.062
2.56
38.48
98
- 0.06
- 2.03
34.50
24
0.06相对误差
1.96绝对误差
31.5
0 施肥量
iy?
ii yy
iii yyy /)?(?
问题 如何评价误差数据?
二.误差分析各类误差数据测量误差截断误差模型假设误差
1,数据测量误差
* 在建立模型之前应该尽量控制实验数据的质量,使之测量准确可靠,
* 数据带有无法消除的测量误差时,应分析它对模型造成的影响,并对模型误差进行估计,
例 6.4.2 有高为 100厘米的半球形容器中装满了水。从某一时刻开始,水从底部一个横截面积为 1平方厘米的小孔流出,可以随时测出水面高度 h。由水力学知,水从孔口流出的流量(即通过孔口横截面的水的体积 V对时间 t 的变化率 )Q,
有关系式
ghShQQ 262.0)(
其中 0.62为流量系数,S 是小孔口横截面积,
g 为重力加速度,
由测出的水面高度 h,可算得水流量,由于仪器所限,测出的高度值有 0.1厘米的误差,这会引起水流量 Q的多大误差?
100h
水面高度 h有误差 Δh
分析 水面高度误差为 Δh,水流量误差则为
ghhhg 262.0)(262.0
)()(0 hQhhQ
)(262.0 hhhg
在 h=50厘米处,代入 Δh=0.1厘米,可算得绝 对误差为
)/(93.1)501.50(980262.0 秒立方厘米
相对误差为
11
262.0
)(262.0


h
h
hg
hhhg
Q
Q
在 h=50 厘米处的相对误差为
0 0 0 9 9 5.01
50
1.01约为 1‰,
2,截断误差截断误差的来源:
1,用数值方法近似求解会产生截断误差;
2,函数近似产生截断误差;
3,计算机运算的精度误差;
应分析截断误差对模型的影响例 6.4.3 广义生日问题一个班有 30名学生,他们中至少有两名同一天生日的概率 p=?
他们生日均不同日的概率为
,
365 30
30
3 6 5Pq?
则 p =1- q.
一般化后,考虑下问题:
xn
x
nxxxxnf
n
1,)1()2)(1()(?
求最小的整数 n,使 f(n)≤q (给定 )
对于给定的 x,f(n)是单调下降函数 (序列 ),
解,可采用求根方法 — 对分法当 q=0.5时,对不同的 x,可以算出 n 的最小值 n*,
见表 (P170表 7.7)的前两列,
q
建立满足 f(n)≤q的最小值 n* 和 x 之间的关系式,
方法一( 最小二乘法 ) 建立经验公式为
xn 17905.157280.0
建立泰勒 近似公式为
xqn )( l n225.05.0
xn 3 8 6 2 9.125.05.0
练习 对两种近似求解方法,计算各个近似值的绝对误差和相对误差,
方法二 泰勒近似泰勒 近似式的误差控制函数
3,模型假设误差通过对数据进行分析可以判断假设是否合理,
续例 6.1.3 施肥效果分析有人做了如下两条假设:
*1 在实验中除施肥量,其他影响因子,如环境条件、种植密度、土壤肥力等,均处于同等水平;
*2 各次实验独立,误差项 ε均服从 N(0,σ2),σ>0
分析,从数据可见在实验点
)3 7 2,1 9 6,2 5 9(),,( 000?kpn
实际重复了三次试验,
第七试验水平问题,三次试验的土豆产量分别为
43.15,41.26,38.43( 单位,t/ha)
按照假设,这 3 次重复试验产生的产量波动完全因随机误差所致,
~ N(μ,σ2)
并且土豆产量满足回归方程合理吗

分析,由 3 个数据计算得
,)ha/t(95.40 y? )(38.2? 样本标准差
95.0}3)({YEYP有概率式如何 解释 这 3个数据的波动?
),,( kpnY
30个试验数据绝大多数落在区间 (33.82,48.07)
之内由施肥水平变化所引起的土豆产量的变动幅度不及随机误差产生的波动幅度大,
不合理不合理的原因:
实际上三 次重复试验带有 系统误差主要来源于土壤肥力,生长期的管理措施等多种试验时的外界条件变化,
试验设计中,把在试验实施过程中外界环境条件的差异所造的系统偏差称为 区组效应,
施肥问题中,对应于每种营养素的 10个施肥试验点,应并为一个区组,
根据有区组效应的数据不可能分析出各个肥素对土豆产量的 交互作用,
利用数据建立模型应尽量消除区组效应通过试验设计,
保证数据质量,
可认为区组内 10次试验的试验条件较为一致,
而不同区组间的试验条件差别较大,