1
第 2章 误差与分析数据处理
2.1 有关误差的一些基本概念
2.2 随机误差的分布
2.3 有限数据的统计处理
2.4 测定方法的选择与测定准确度的提高
2.5 有效数字
2
参考书
罗旭著,化学统计学,
科学出版社,2001.
郑用熙著,
分析化学中的数理统计方法,
科学出版社,1986.
( 分析化学丛书,第一卷第七册)
3
2.1 有关误差的一些基本概念
2.1.1 准确度和精密度
1,准确度测定结果与“真值”接近的程度,
绝对误差相对误差 a 100%rE ET
aE x T
4
例,滴定的体积误差
V Ea Er
20.00 mL? 0.02 mL? 0.1%
2.00 mL? 0.02 mL? 1%
称量误差
m Ea Er
0.2000 g? 0.2 mg? 0.1%
0.0200 g? 0.2 mg? 1%
滴定剂体积应为 20~ 30mL
称样质量应大于 0.2g
5
a
6 2,3 8 %,6 2,3 2 %
0,0 6 %
Tx
xTE


例 1 测定含铁样品 中 w(Fe),比较结果的准确度。
A,铁矿中,
B,Li2CO3试样中,
A.
B.
a
r
a
r
100% - 0,0 6 / 6 2,3 8 0,1
100%
%0,0 0 2 / 0,0 4 2 5
%E
E
T
E
T
E


a
0,0 4 2 %,0,0 4 4 %
0,0 0 2 %
Tx
xTE


6
2,精密度精密度 表示平行测定的结果互相靠近的程度,一般用 偏差 表示。
7
3,准确度与精密度的关系
1x
2x
3x
4x
1.精密度是保证准确度的先决条件 ;
2.精密度好,不一定准确度高,
8
2.1.2 误差的产生及减免办法
1,系统误差具单向性、重现性,为可测误差,
方法,溶解损失、终点误差
— 用其他方法校正仪器,刻度不准、砝码磨损
— 校准 (绝对、相对 )
操作,颜色观察试剂,不纯 — 空白实验对照实验:标准方法、标准样品、标准加入
9
重 做 !
例:指示剂的选择
2.随机误差 (偶然误差 )
不可避免,服从统计规律。
3.过失由粗心大意引起,可以避免。
10
2.2 随机误差的分布规律
2.2.1 频率分布事例:
测定 w(BaCl2·2H2O),173个有效数据,
处于 98.9% ~ 100.2%范围,
按 0.1%组距分 14组,
作 频率密度 -测量值 (%) 图,
11
频率密度直方图和频率密度多边形
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
9
8
.8
5
9
8
.9
5
9
9
.0
5
9
9
.1
5
9
9
.2
5
9
9
.3
5
9
9
.4
5
9
9
.5
5
9
9
.6
5
9
9
.7
5
9
9
.8
5
9
9
.9
5
1
0
0
.0
5
1
0
0
.1
5
2a áμ £¨ % £?
μ
ê
ü
è
87%(99.6%± 0.3)
99.6%(平均值)
12
2.2.2 正态分布曲线 N(?,?)
特点,
1,极大值在 x = μ 处,
2,拐点在 x = μ ± σ 处,
3,于 x = μ 对称,
4,x 轴为渐近线,
y,概率密度
x,测量值
μ,总体平均值
x-μ,随机误差
σ,总体标准差
2
2
()
21()
2
x
y f x e



13
随机误差的规律定性,
1,小误差出现的概率大,大误差出现的概率小,特大误差概率极小 ;
2,正、负误差出现的概率相等,
定量,某段曲线下的面积则为概率,
14
标准正态分布曲线
2
2
1
()
2
u
fx
u
x
u e

横坐标改用 表示
2
21,( )
2
u
yu e?

15
0
0,1
0,2
0,3
0,4
-4 -3 -2 -1 0 1 2 3 4
68.3%
95.5%
99.7%
u
-3? -2? -? 0? 2? 3? x-?
-3-2-++2+3? x
标准正态分布曲线 N (0,1)
16
曲线下面积 22
0
1 1,0,3 4 1
2
u duu
euss
当时
| u | s 2s
0.674 0.2500
1.000 0.3413 0.683
1.645 0.4500
1.960 0.4750 0.950
2.000 0.4773
2.576 0.4987 0.990
3.000 0.4987 0.997
∞ 0.500 1.000
正态分布概率积分表y
17
随机误差 u出现的区间
(以 σ 为单位 ) 测量值出现的区间 概 率 p
(-1,+1) (μ-1σ,μ+1σ) 68.3%
(-1.96,+1.96) (μ-1.96σ,μ+1.96σ) 95.0%
(-2,+2) (μ-2σ,μ+2σ) 95.5%
(-2.58,+2.58) (μ-2.58σ,μ+2.58σ) 99.0%
(-3,+3) (μ-3σ,μ+3σ) 99.7%
随机误差的区间概率
18
2.3 有限数据的统计处理样本容量 n,样本所含的个体数,
总体 样本 数据抽样 观测统计处理
19
2.3.1 数据的集中趋势
1
1
,
n
i
i
xx
n?
1,样本平均值
2,x中位数
20
2.3.2 数据分散程度的表示
/id dn平均偏差,
100%dRd
x
相对平均偏差:
1.极差 (全距 ) R = xmax - xmin
相对极差 (R / ) × 100%
2.偏差 绝对偏差 di = xi-
相对偏差 Rdi = (di / ) × 100%
x
x
x
21
3,标准差
2()
1
ixx
n
s
样本标准差:
2()
i
x
n
总体标准差:
( - 1 ) nf为自由度,用 表示相对标准差 ( RSD,又称变异系数 )
CV=(s / )× 100% x
22
1 5 10 15 20 n
0.0
0.2
0.4
0.6
0.8
1.0


2
2
1
i
i
xx
n
x
n
s
当 n?∞,s
4,平均值的标准差
n为一组测定的样本数
xx
s
s
nn

23
2.3.3 总体均值的置信区间
— 对 μ 的区间估计在一定的置信度下 (把握性 ),
估计总体均值可能存在的区间,
称 置信区间,
24
置信区间? 根据随机误差的区间概率
u = 1.96,S = 0.475,
即 x 出现在
( μ -1.96σ,μ +1.96 σ )
范围内的概率 p = 95,0 %.
也即在无限多的
(x -1.96 σ,x +1.96 σ )
范围内包含 μ 的概率
p = 95,0 %.
25
· 若平行测定 n 次,μ 的置信区间为
(,)x u x u
nn

对于随机测得的 x值,μ 包含在 (x -1.96 σ,x +
1.96 σ ) 内的可能性 (置信度 )为 95.0%.
若 置信度 (把握 )为 95%,u = 1.96,则 μ 的置信区间为 (x - 1.96 σ,x + 1.96 σ ).
26
对于 有限次测量,,n,s
总体均值 μ 的置信区间为
(,)
ss
x t x t
nn

t 与置信度 p 和自由度 f 有关
x
27
t 分布曲线
f = n-
1
f= ∞
f= 10
f= 2
f= 1
-3 -2 -1 0 1 2 3 t
y (概率密度 )
x
xx
tn
ss


28
称小概率又称显著水平;
1-? = 置信度 p
-t?(f) t?(f)
y
29
t 分布值表
tα ( f )
f
显 著 水 平 α
0.50 *0.10 *0.05 0.01
1 1.00 6.31 12.71 63.66
2 0.82 2.92 4.30 9.93
3 0.77 2.35 3.18 5.84
4 0.74 2.13 2.78 4.60
5 0.73 2.02 2.57 4.03
6 0.72 1.94 2.45 3.71
7 0.71 1.90 2.37 3.50
8 0.71 1.86 2.31 3.36
20 0.69 1.73 2.09 2.85
∞ 0.67 1.64 1.96 2.58
30
( 1- ),
(,)x u x u
nn




置信度为 时 的置信区间为
σ已知时,
置信区间的确定
31
例 2 分析铁矿石中 w(Fe)的结果,
n = 4,= 35.21 %,σ = 0.06 %
求,μ 的 95%置信区间。
0.05
1 0,95,0,05,1,96
0,06 % 0,06 %
( 35,2 1% 1,96,35,2 1% 1,96 )
44
( 35,1 5%,35,2 7% )
u

(,)x u x u
nn

解,μ 的置信区间为
x
32
( ( ),(
( 1 - ),
))
ss
x t f x t f
nn



置信度为 时 的置信区间为
σ未知时,
x例 3 测 w(Fe),n = 4,= 35.21%,
s = 0.06%
求,(1) 置信度为 95%时?的置信区间 ;
(2) 置信度为 99%时?的置信区间,
33
解,0.05( 1 ) 1 0.95,0.05,( 3 ) 3.18
95%,
0.06% 0.06%
( 35.2 1% 3.18,35.2 1% 3.18 )
44
(3 5.11%,35,1= 3 %)
t


得 的 置信区间
0,0 1( 2 ) 1 0,9 9,0,0 1,( 3 ) 5,8 4
99 ( 3 5,0 3 %,3 5,),39% %
t

得 的 置信区间结果表明置信度高则置信区间大,
34
2.3.4 显著性检验
1,测定值与标准值比较
a,u检验法 (?已知 )
(1) 提出假设,μ = μ0
(2) 给定显著水平 α
(3) 计算 0xu
n

(4) 查 u 表,若 u计 > u?,否定假设,
即 μ 与 μ0 有显著差异,测定存在系统误差,
35
0
接受域拒绝域 拒绝域

-u? u?
拒绝域和接受域
36
例 4 已知铁水中 w(C) = 4.55%(μ0 ),σ = 0.08 %.
现又测 5 炉铁水,w(C)分别为 (%):
4.28,4.40,4.42,4.35,4.37.
试问均值有无变化?(α = 0.05)
解 假设 μ = μ0 = 4.55%,= 4.36%x
0 4,3 6 % 4,5 5 % 3,9
0,0 8 % / 5
x
u
n

计查表知 u0.05 = 1.96,u计 = 3.9>1.96
拒绝假设,即平均含碳量比原来的降低了,
37
b.t 检验法 (?未知 )
(1) 提出假设,μ = μ0
(2) 给定显著水平 α
(3) 计算
0x
t
s
n


(4) 查 t 表,若 拒绝假设,()t t f

38
例 5 已知 w(CaO)=30.43%,测得结果为,
n = 6,= 30.51%,s = 0.05%.
问此测定有无系统误差?(α=0.05)
x
解 假设 μ = μ0 = 30.43%
0 3 0,5 1 % 3 0,4 3 % 3,9
0,0 5 % / 6
x
t
s
n

计查 t 表,t0.05(5) = 2.57,t计 > t表拒绝假设,此测定存在系统误差,
39
2,两组测量结果比较第一步,F 检验 —比较两组的精密度
(1) 假设,σ1 = σ2
2
2( 2 )
s
F
s
大计算小
/2
12
(,)F F f f?

12计算( 3 ) 如 <

0.050.05
F1 F2拒绝域 接受域 拒绝域
F
40
自由度 分 子 f1 ( )2 3 4 5 6 7 ∞
f2
2 19.00 19.16 19.25 19.30 19.33 19.36 19.50
3 9.55 9.28 9.12 9.01 8.94 8.88 8.53
4 6.94 6.59 6.39 6.26 6.16 6.09 5.63
5 5.79 5.41 5.19 5.05 4.95 4.88 4.36
6 5.14 4.76 4.53 4.39 4.28 4.21 3.67
7 4.74 4.35 4.12 3.97 3.87 3.79 3.23
8 4.46 4.07 3.84 3.69 3.58 3.50 2.93
9 4.26 3.86 3.63 3.48 3.37 3.29 2.71
∞ 3.00 2.60 2.37 2.21 2.10 2.01 1.00
显著水平为 0.05的 F 分布值表较大 s
分母
41
12 12
12
22
1 1 2 2
12
( 2 )
( 1 ) ( 1 )
:
2
p
p
xx nn
t
s n n
n s n s
s
nn


计算合并标准差第二步,t 检验 —比较 与
1x
1 2 1 2,( 2 ),t t n n计(3) 如 则检验表明 σ1 = σ2后,
(1) 假设 μ1 = μ2
2x
42
12
12
12
= 5 = 4
= 42,34% = 42,44%,
= 0.1 0% = 0 12
1
.%
nn
xx
ss
方法 方法2
例 6 用两种方法测定 w(Na2CO3)
43
2
2 = 0,1 2 2 /0,1 0 2 = 1,4 4
s
F
s
大计算小
F计 <F0.05(3,4)=6.59,σ1 和 σ2 无显著差异;
12 12
0,0 5
12
1,3 6 ( 7 ) 2,3 7
p
xx nn
tt
s n n


计算
2,t 检验 (给定?= 0.05)
两种方法不存在系统误差。
1,F 检验 (给定? = 0.10)
解:
44
2.3.5 异常值的检验 —Q检验法
m a x m in
xx
Q
xx
邻近离群计算
,.QQ?计 表若 则离群值应弃去
45
Q值表测量次数
n 3 4 5 6 7 8 9 10
Q0.90 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41
Q0.95 0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49
46
例 7 测定某溶液浓度 (mol·L-1),得结果,
0.1014,0.1012,0.1016,0.1025,
问,0.1025是否应弃去?
(置信度为 90%)
0,9 0
0,1 0 2 5 0,1 0 1 6 0,6 9 ( 4) 0,7 6
0,1 0 2 5 0,1 0 1 2QQ

计算
0.1025应该保留,
x = 0.1015~
0 1017x?,
47
2.4 测定方法的选择与测定准确度的提高
1,选择合适的分析方法,根据待测组分的含量、
性质、试样的组成及对准确度的要求选方法;
2,减小测量误差,取样量、滴定剂体积等;
3,平行测定 4~ 6次,使平均值更接近真值;
4,消除系统误差,
(1) 显著性检验确定有无系统误差存在,
(2) 找出原因,对症解决,
48
作 业
2.1 2.3 2.5 2.6 2.7
49
2.5 有效数字包括全部可靠数字及一位不确定数字在内
m ◇ 台秤 (称至 0.1g):12.8g(3),0.5g(1),1.0g(2)
◆ 分析天平 (称至 0.1mg):12.8218g(6),
0.5024g(4),0.0500g(3)
V ★ 滴定管 (量至 0.01mL):26.32mL(4),3.97mL(3)
★ 容量瓶,100.0mL(4),250.0mL (4)
★ 移液管,25.00mL(4);
☆ 量筒 (量至 1mL或 0.1mL):26mL(2),4.0mL(2)
50
1,数字前的 0不计,数字后的计入,0.02450(4位 )
2,数字后的 0含义不清楚时,最好用指数形式表示,
1000 (1.0× 103,1.00× 103,1.000 × 103 )
3,自然数可看成具有无限多位数 (如倍数关系、
分数关系 );常数亦可看成具有无限多位数,

,e?
几项规定
51
4,数据的第一位数大于等于 8 的,可按多一位有效数字对待,如 9.45× 104,95.2%,8.6
5,对数与指数的有效数字位数按尾数计,
如 10-2.34 (2位 ); pH=11.02,则 [H+]=9.5× 10-12
6,误差只需保留 1~ 2位;
7,化学平衡计算中,结果一般为两位有效数字 (由于 K
值一般为两位有效数字 );
8,常量分析法一般为 4 位有效数字 (Er≈0.1% ),微量分析为 2~3位,
52
运算规则加减法,结果的绝对误差应不小于各项中绝对误差最大的数,(与小数点后位数最少的数一致 )
50.1 50.1
1.46 1.5
+ 0.5812 + 0.6
52.1412 52.2
52.1 一般计算方法,先计算,后修约,
53
结果的相对误差应与各因数中相对误差最大的数相适应,
(即与有效数字位数最少的一致 )
例 0.0121× 25.66× 1.0578= 0.328432
= 0.328
乘除法,
54


3
3
3
1
0,1 0 0 0 2 5,0 0 0,1 0 0
C a C
0 2 4,1 0 ( C a C O )
2
O
10
s
M
m
w?


3
0,1 0 0 0 2 5,0 0 0,1 0 0 0 2 4,1 0 1 0 0,1 / 2
0,2 3 5 1 1 0
0,0 1 9 1 5 9 9

例 N aO H
3 2 2 2C a C O H C l C a C l H O C O H C l ( ) 过量
0.0192
55
复杂运算 (对数、乘方、开方等)
例 pH=5.02,[H+]=?
pH= 5.01 [H+]= 9.7724× 10-6
pH= 5.02 [H+]= 9.5499× 10-6
pH= 5.03 [H+]= 9.3325× 10-6
∴ [H+]= 9.5× 10-6 mol ·L-1
56
报告结果,与方法精度一致,由误差最大的一步确定,
如 称样 0.0320g,则 w(NaCl) = 99%(3位 );
称样 0,3200g,则 w(NaCl) = 99.2%(4位 );
光度法 测 w(Fe),测量误差约 5%,
则 w(Fe) = 0.064% (2位 )
要求称样准至 3位有效数字即可,
合理安排操作程序,实验既准又快!
57
第二章小结一,误差的分类和表示 (准确度,x,T、
Ea,Er;精密度 );
二,随机误差的分布,规律、区间概率、
x,y,μ,σ,x-μ,u,p
三,有限数据的统计处理
1,集中趋势,,x x
58
2,分散程度,R,RR,di,Rdi、,R,
s,σ、,,RSD (CV)
3,平均值的置信区间,σ - u,s – t
4,显著性检验,u 检验法,t 检验法、
( F检验 +t 检验)法
5,离群值的取舍,Q检验法四,提高分析准确度的方法五,有效数字,位数确定、运算规则、修约规则、报告结果,
xs x?
dd
59
作 业
2.8 2.9 2.10