1
第 2章 误差与分析数据处理
2.1 有关误差的一些基本概念
2.2 随机误差的分布
2.3 有限数据的统计处理
2.4 测定方法的选择
与测定准确度的提高
2.5 有效数字
2
参考书
? 罗旭著,化学统计学,
科学出版社,2001.
? 郑用熙著,
分析化学中的数理统计方法,
科学出版社,1986.
( 分析化学丛书,第一卷第七册)
3
2.1 有关误差的一些基本概念
2.1.1 准确度和精密度
1,准确度
测定结果与“真值”接近的程度,
绝对误差
相对误差 a 100%rE ET??
aE x T??
4
例, 滴定的体积误差
V Ea Er
20.00 mL ? 0.02 mL ? 0.1%
2.00 mL ? 0.02 mL ? 1%
称量误差
m Ea Er
0.2000 g ? 0.2 mg ? 0.1%
0.0200 g ? 0.2 mg ? 1%
滴定剂体积应为 20~ 30mL
称样质量应大于 0.2g
5
a
6 2, 3 8 %,6 2, 3 2 %
0, 0 6 %
Tx
xTE
??
?? ??
例 1 测定含铁样品 中 w(Fe),比较结果的准确度。
A,铁矿中,
B,Li2CO3试样中,
A.
B.
a
r
a
r
100% - 0,06 / 62,3 8 0,1
100%
%0,00 2 / 0,04 2 5
%E
E
T
E
T
E
? ? ? ?
? ? ? ?
?
a
0, 0 4 2 %,0, 0 4 4 %
0, 0 0 2 %
Tx
xTE
??
? ? ?
6
2,精密度
精密度 表示平行测定的结果互相靠近
的程度,一般用 偏差 表示。
7
3,准确度与精密度的关系
1x
2x
3x
4x
1.精密度是保证准确度的先决条件 ;
2.精密度好,不一定准确度高,
8
2.1.2 误差的产生及减免办法
1,系统误差
具单向性、重现性,为可测误差,
方法, 溶解损失、终点误差
— 用其他方法校正
仪器, 刻度不准、砝码磨损
— 校准 (绝对、相对 )
操作, 颜色观察
试剂, 不纯 — 空白实验
对照实验:标准方法、标准样品、标准加入
9
重 做 !
例:指示剂的选择
2.随机误差 (偶然误差 )
不可避免,服从统计规律。
3.过失
由粗心大意引起,可以避免。
10
2.2 随机误差的分布规律
2.2.1 频率分布
事例:
测定 w(BaCl2·2H2O),173个有效数据,
处于 98.9% ~ 100.2%范围,
按 0.1%组距分 14组,
作 频率密度 -测量值 (%) 图,
11
频率密度直方图和频率密度多边形
0,0
0,5
1,0
1,5
2,0
2,5
3,0
3,5
9
8
.8
5
9
8
.9
5
9
9
.0
5
9
9
.1
5
9
9
.2
5
9
9
.3
5
9
9
.4
5
9
9
.5
5
9
9
.6
5
9
9
.7
5
9
9
.8
5
9
9
.9
5
1
0
0
.0
5
1
0
0
.1
5
2a á? ?μ £¨ % £?




87%(99.6%± 0.3)
99.6%(平均值)
12
2.2.2 正态分布曲线 N(?,?)
特点,
1,极大值在 x = μ 处,
2,拐点在 x = μ ± σ 处,
3,于 x = μ 对称,
4,x 轴为渐近线,
y,概率密度
x,测量值
μ,总体平均值
x-μ,随机误差
σ, 总体标准差
2
2
()
21()
2
x
y f x e
?
?
??
??
??
13
随机误差的规律
定性,
1,小误差出现的概率大,大误差出现的
概率小,特大误差概率极小 ;
2,正、负误差出现的概率相等,
定量,某段曲线下的面积则为概率,
14
标准正态分布曲线
2
2
1
()
2
u
fx
u
x
u e
??
?
?
?
?
?
?
横坐标改用 表示
2
21,( )
2
u
yu e?
?
?
??即
15
0
0, 1
0, 2
0, 3
0, 4
-4 -3 -2 -1 0 1 2 3 4
68.3%
95.5%
99.7%
u
-3? -2? -? 0 ? 2? 3? x-?
?-3? ?-2? ?-? ? ?+? ?+2? ?+3? x
标准正态分布曲线 N (0,1)
16
曲线下面积
2
2
0
1 1,0,3 4 1
2
u duu
euss
?
?
? ? ?? 当时
| u | s 2s
0.674 0.2500
1.000 0.3413 0.683
1.645 0.4500
1.960 0.4750 0.950
2.000 0.4773
2.576 0.4987 0.990
3.000 0.4987 0.997
∞ 0.500 1.000
正态分布概率积分表y
17
随机误差 u出现的区间
(以 σ 为单位 ) 测量值出现的区间 概 率 p
(-1,+1) (μ-1σ,μ+1σ) 68.3%
(-1.96,+1.96) (μ-1.96σ,μ+1.96σ) 95.0%
(-2,+2) (μ-2σ,μ+2σ) 95.5%
(-2.58,+2.58) (μ-2.58σ,μ+2.58σ) 99.0%
(-3,+3) (μ-3σ,μ+3σ) 99.7%
随机误差的区间概率
18
2.3 有限数据的统计处理
样本容量 n,样本所含的个体数,
总体 样本 数据抽样 观测
统计处理
19
2.3.1 数据的集中趋势
1
1
,
n
i
i
xx
n ?
? ?1,样本平均值
2,x中位数
20
2.3.2 数据分散程度的表示
/id dn? ?平均偏差,
100%dRd
x
??相对平均偏差:
1.极差 (全距 ) R = xmax - xmin
相对极差 (R / ) × 100%
2.偏差 绝对偏差 di = xi-
相对偏差 Rdi = (di / ) × 100%
x
x
x
21
3,标准差
2()
1
ixx
n
s
?
?
?
?样本标准差:
2()
i
x
n
?
?
?
? ?总体标准差:
( - 1 ) nf为自由度,用 表示
相对标准差 ( RSD,又称变异系数 )
CV=(s / )× 100% x
22
1 5 10 15 20 n
0.0
0.2
0.4
0.6
0.8
1.0
? ?
? ?
2
2
1
i
i
xx
n
x
n
s
?
?
?
?
?
?
?
?
?
当 n?∞,s??
4,平均值的标准差
n为一组测定的样本数
xx
s
s
nn
?
???
23
2.3.3 总体均值的置信区间
— 对 μ 的区间估计
在一定的置信度下 (把握性 ),
估计总体均值可能存在的区间,
称 置信区间,
24
置信区间 ? 根据随机误差的区间概率
u = 1.96,S = 0.475,
即 x 出现在
( μ -1.96σ,μ +1.96 σ )
范围内的概率 p = 95,0 %.
? 也即在无限多的
(x -1.96 σ,x +1.96 σ )
范围内包含 μ 的概率
p = 95,0 %.
25
· 若平行测定 n 次,μ 的置信区间为
(,)x u x u
nn??
????
? 对于随机测得的 x值,μ 包含在 (x -1.96 σ,x +
1.96 σ ) 内的可能性 (置信度 )为 95.0%.
? 若 置信度 (把握 )为 95%,u = 1.96,则 μ 的
置信区间为 (x - 1.96 σ,x + 1.96 σ ).
26
对于 有限次测量,, n,s
总体均值 μ 的置信区间为
(,)
ss
x t x t
nn
??
t 与置信度 p 和自由度 f 有关
x
27
t 分布曲线
f = n-
1
f= ∞
f= 10
f= 2
f= 1
-3 -2 -1 0 1 2 3 t
y (概率密度 )
x
xx
tn
ss
????
??
28
? 称小概率
又称显著水平;
1- ? = 置信度 p? ? ? ?
-t?(f) t?(f)
y
29
t 分布值表
tα ( f )
f
显 著 水 平 α
0.50 *0.10 *0.05 0.01
1 1.00 6.31 12.71 63.66
2 0.82 2.92 4.30 9.93
3 0.77 2.35 3.18 5.84
4 0.74 2.13 2.78 4.60
5 0.73 2.02 2.57 4.03
6 0.72 1.94 2.45 3.71
7 0.71 1.90 2.37 3.50
8 0.71 1.86 2.31 3.36
20 0.69 1.73 2.09 2.85
∞ 0.67 1.64 1.96 2.58
30
( 1- ),
(,)x u x u
nn
??
??
??
??
置信度为 时 的置信区间为
σ已知时,
置信区间的确定
31
例 2 分析铁矿石中 w(Fe)的结果,
n = 4,= 35.21 %,σ = 0.06 %
求, μ 的 95%置信区间。
0.05
1 0.9 5,0.0 5,1.9 6
0.0 6% 0.0 6%
( 35,21 % 1.9 6,35,21 % 1.9 6 )
44
( 35,15 %,35,27 % )
u??? ? ? ?
? ? ? ?
?
(,)x u x u
nn??
????
解, μ 的置信区间为
x
32
( ( ),(
( 1 - ),
))
ss
x t f x t f
nn
??
??
??
置信度为 时 的置信区间为
σ未知时,
x例 3 测 w(Fe),n = 4,= 35.21%,
s = 0.06%
求, (1) 置信度为 95%时 ?的置信区间 ;
(2) 置信度为 99%时 ?的置信区间,
33
解,
0.05
( 1 ) 1 0.95,0.05,( 3 ) 3.18
95%,
0.06 % 0.06 %
( 35.2 1% 3.18,35.2 1% 3.18 )
44
(3 5.11 %,35,1= 3 %)
t??
?
? ? ? ?
? ? ? ?
得 的 置信区间
0, 0 1( 2 ) 1 0, 9 9,0, 0 1,( 3 ) 5, 8 4
99 ( 3 5, 0 3 %,3 5, ),39% %
t??
?
? ? ? ?
得 的 置信区间
结果表明置信度高则置信区间大,
34
2.3.4 显著性检验
1,测定值与标准值比较
a,u检验法 (?已知 )
(1) 提出假设, μ = μ0
(2) 给定显著水平 α
(3) 计算 0
x
u
n
?
?
?
?计
(4) 查 u 表,若 u计 > u?,否定假设,
即 μ 与 μ0 有显著差异,测定存在系统误差,
35
0
接受域拒绝域 拒绝域
? ? ? ?
-u? u?
拒绝域和接受域
36
例 4 已知铁水中 w(C) = 4.55%(μ0 ),σ = 0.08 %.
现又测 5 炉铁水,w(C)分别为 (%):
4.28,4.40,4.42,4.35,4.37.
试问均值有无变化?(α = 0.05)
解 假设 μ = μ0 = 4.55%,= 4.36%x
0 4,3 6 % 4,5 5 % 3,9
0,0 8 % / 5
x
u
n
?
?
? ?
? ? ?计
查表知 u0.05 = 1.96,u计 = 3.9>1.96
拒绝假设,即平均含碳量比原来的降低了,
37
b.t 检验法 (?未知 )
(1) 提出假设, μ = μ0
(2) 给定显著水平 α
(3) 计算 0x
t
s
n
??
?

(4) 查 t 表,若 拒绝假设,()t t f
??计
38
例 5 已知 w(CaO)=30.43%,测得结果为,
n = 6,= 30.51%,s = 0.05%.
问此测定有无系统误差?(α=0.05)
x
解 假设 μ = μ0 = 30.43%
0 3 0,5 1 % 3 0,4 3 % 3,9
0,0 5 % / 6
x
t
s
n
?? ?
? ? ?计
查 t 表,t0.05(5) = 2.57,t计 > t表
拒绝假设,此测定存在系统误差,
39
2,两组测量结果比较
第一步, F 检验 —比较两组的精密度
(1) 假设,σ1 = σ2
2
2( 2 )
s
F
s
? 大计算

/2
12
(,)F F f f?
?? ?
12计算( 3 ) 如 <

0.050.05
F1 F2拒绝域 接受域 拒绝域
F
40
自由度 分 子 f1 ( )2 3 4 5 6 7 ∞
f2
2 19.00 19.16 19.25 19.30 19.33 19.36 19.50
3 9.55 9.28 9.12 9.01 8.94 8.88 8.53
4 6.94 6.59 6.39 6.26 6.16 6.09 5.63
5 5.79 5.41 5.19 5.05 4.95 4.88 4.36
6 5.14 4.76 4.53 4.39 4.28 4.21 3.67
7 4.74 4.35 4.12 3.97 3.87 3.79 3.23
8 4.46 4.07 3.84 3.69 3.58 3.50 2.93
9 4.26 3.86 3.63 3.48 3.37 3.29 2.71
∞ 3.00 2.60 2.37 2.21 2.10 2.01 1.00
显著水平为 0.05的 F 分布值表
较大 s


41
12 12
12
22
1 1 2 2
12
( 2 )
( 1 ) ( 1 )
:
2
p
p
xx nn
t
s n n
n s n s
s
nn
?
?
?
? ? ?
?
??
计算
合并标准差
第二步, t 检验 —比较 与
1x
1 2 1 2,( 2 ),t t n n? ??? ? ? ?计(3) 如 则
检验表明 σ1 = σ2后,
(1) 假设 μ1 = μ2
2x
42
12
12
12
= 5 = 4
= 4 2,3 4 % = 4 2,4 4 %,
= 0,1 0 % = 0 1 2
1
.%
nn
xx
ss
方法 方法2
例 6 用两种方法测定 w(Na2CO3)
43
2
2 = 0, 1 2 2 /0, 1 0 2 = 1, 4 4
s
F
s
? 大计算

F计 <F0.05(3,4)=6.59,σ1 和 σ2 无显著差异;
12 12
0, 0 5
12
1, 3 6 ( 7 ) 2, 3 7
p
xx nn
tt
s n n
? ?
? ? ? ?
?计算
2,t 检验 (给定 ?= 0.05)
两种方法不存在系统误差。
1,F 检验 (给定 ? = 0.10)
解:
44
2.3.5 异常值的检验 —Q检验法
m a x m in
xx
Q
xx
?
?
?
邻近离群
计算
,.QQ ?计 表若 则离群值应弃去
45
Q值表
测量次数
n 3 4 5 6 7 8 9 10
Q0.90 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41
Q0.95 0.97 0.84 0.73 0.64 0.59 0.54 0.51 0.49
46
例 7 测定某溶液浓度 (mol·L-1),得结果,
0.1014,0.1012,0.1016,0.1025,
问, 0.1025是否应弃去?
(置信度为 90%)
0, 9 0
0, 1 0 2 5 0, 1 0 1 6 0, 6 9 ( 4) 0, 7 6
0, 1 0 2 5 0, 1 0 1 2QQ
?? ? ? ?
?计算
0.1025应该保留,
x = 0.1015~
0 1 0 1 7x ?,
47
2.4 测定方法的选择与
测定准确度的提高
1,选择合适的分析方法,根据待测组分的含量、
性质、试样的组成及对准确度的要求选方法;
2,减小测量误差,取样量、滴定剂体积等;
3,平行测定 4~ 6次,使平均值更接近真值;
4,消除系统误差,
(1) 显著性检验确定有无系统误差存在,
(2) 找出原因,对症解决,
48
作 业
2.1 2.3 2.5 2.6 2.7
49
2.5 有效数字
包括全部可靠数字及一位不确定数字在内
m ◇ 台秤 (称至 0.1g):12.8g(3),0.5g(1),1.0g(2)
◆ 分析天平 (称至 0.1mg):12.8218g(6),
0.5024g(4),0.0500g(3)
V ★ 滴定管 (量至 0.01mL):26.32mL(4),3.97mL(3)
★ 容量瓶,100.0mL(4),250.0mL (4)
★ 移液管,25.00mL(4);
☆ 量筒 (量至 1mL或 0.1mL):26mL(2),4.0mL(2)
50
1,数字前的 0不计,数字后的计入, 0.02450(4位 )
2,数字后的 0含义不清楚时,最好用指数形式表示,
1000 (1.0× 103, 1.00× 103,1.000 × 103 )
3,自然数可看成具有无限多位数 (如倍数关系、
分数关系 );常数亦可看成具有无限多位数,
如,e?
几项规定
51
4,数据的第一位数大于等于 8 的,可按多一位有效数
字对待,如 9.45× 104,95.2%,8.6
5,对数与指数的有效数字位数按尾数计,
如 10-2.34 (2位 ); pH=11.02,则 [H+]=9.5× 10-12
6,误差只需保留 1~ 2位;
7,化学平衡计算中,结果一般为两位有效数字 (由于 K
值一般为两位有效数字 );
8,常量分析法一般为 4 位有效数字 (Er≈0.1% ),微
量分析为 2~3位,
52
运算规则
加减法, 结果的绝对误差应不小于各项中绝对
误差最大的数,(与小数点后位数最少的数一致 )
50.1 50.1
1.46 1.5
+ 0.5812 + 0.6
52.1412 52.2
52.1 一般计算方法,先计算,后修约,
53
结果的相对误差应与各因数中相对误差最
大的数相适应,
(即与有效数字位数最少的一致 )
例 0.0121× 25.66× 1.0578= 0.328432
= 0.328
乘除法,
54
? ?
? ?
3
3
3
1
0, 1 0 0 0 2 5, 0 0 0, 1 0 0
C a C
0 2 4, 1 0 ( C a C O )
2
O
10
s
M
m
w ?
? ? ?
?
?
? ?
3
0,10 00 25,0 0 0,10 00 24,1 0 10 0,1 / 2
0,23 51 10
0,01 91 59 9
? ? ? ?
?
?
?
例 N aO H
3 2 2 2C a C O H C l C a C l H O C O H C l ( )? ? ? ? ? 过量
0.0192
55
复杂运算 (对数、乘方、开方等)
例 pH=5.02,[H+]=?
pH= 5.01 [H+]= 9.7724× 10-6
pH= 5.02 [H+]= 9.5499× 10-6
pH= 5.03 [H+]= 9.3325× 10-6
∴ [H+]= 9.5× 10-6 mol ·L-1
56
报告结果, 与方法精度一致,由误差
最大的一步确定,
如 称样 0.0320g,则 w(NaCl) = 99%(3位 );
称样 0,3200g,则 w(NaCl) = 99.2%(4位 );
光度法 测 w(Fe),测量误差约 5%,
则 w(Fe) = 0.064% (2位 )
要求称样准至 3位有效数字即可,
合理安排操作程序,实验既准又快!
57
第二章小结
一, 误差的分类和表示 (准确度,x,T、
Ea,Er;精密度 );
二,随机误差的分布, 规律、区间概率、
x,y, μ, σ,x-μ,u,p
三,有限数据的统计处理
1,集中趋势,,x x
58
2,分散程度, R,RR,di,Rdi、, R,
s,σ、,, RSD (CV)
3,平均值的置信区间, σ - u, s – t
4,显著性检验, u 检验法,t 检验法、
( F检验 +t 检验)法
5,离群值的取舍, Q检验法
四,提高分析准确度的方法
五,有效数字, 位数确定、运算规则、修
约规则、报告结果,
xs x?
dd
59
作 业
2.8 2.9 2.10