第五章 误差及分析数据的处理
第一节 概述
? 误差客观存在
? 定量分析数据的归纳和取舍(有效数字)
? 计算误差,评估和表达结果的可靠性和精密度
? 了解原因和规律, 减小误差, 测量结果 →真值
第二节 测量误差
一, 误差分类及产生原因
二, 误差的表示方法
三, 误差的传递
四, 提高分析结果准确度的方法
一、误差分类及产生原因
(一)系统误差及其产生原因
(二)偶然误差及其产生原因
(一) 系统误差 (可定误差),
由可定原因产生
1.特点:具单向性(大小、正负一定 )
可消除(原因固定)
重复测定重复出现
2,分类:
( 1) 按来源分
a.方法误差:方法不恰当产生
b.仪器与试剂误差:仪器不精确和试剂中含被测
组分或不纯组分产生
c,操作误差,操作方法不当引起
( 2) 按数值变化规律分
a,恒定误差
b,比值误差
(二) 偶然误差 (随机误差,不可定误差):
由不确定原因引起
特点:
1)不具单向性 ( 大小, 正负不定 )
2)不可消除 ( 原因不定 )
但可减小 ( 测定次数 ↑)
3) 分布服从统计学规律 ( 正态分布 )
二、误差的表示方法
( 一 ) 准确度与误差
( 二 ) 精密度与偏差
( 三 ) 准确度与精密度的关系
(一 )准确度与误差
1,准确度,指测量结果与真值的接近程度
2,误差
( 1) 绝对误差,测量值与真实值之差
( 2) 相对误差,绝对误差占真实值的百分比
? ?? ?x
RE x% ? ? ? ? ??? ??100% 100%
RE x% ? ?? 100%
注,1)测高含量组分,RE可小;测低含量组分,RE可大
2)仪器分析法 —— 测低含量组分,RE大
化学分析法 —— 测高含量组分,RE小
注,μ 未知,δ 已知,可用 χ 代替 μ
(二)精密度与偏差
1,精密度,平行测量的各测量值间的相互接近程度
2.偏差:
( 1)绝对偏差,单次测量值与平均值之差
( 2) 相对偏差:绝对偏差占平均值的百分比
d x xi? ?
d
x
x x
x
i? ? ? ?100% 100%
( 5)标准偏差:
( 6)相对标准偏差(变异系数)
续前 ( 3)平均偏差:各测量值绝对偏差的算术平均值
( 4) 相对平均偏差:平均偏差占平均值的百分比
n
xx
d i?
?
?
%1 0 0%1 0 0 ?
?
?
??
?
xn
xxi
x
d
n
x
n
i
i
x
?
?
?
? 1
2)( ?
?
1
)(
1
2
?
?
?
?
?
n
xx
S
n
i
i
x
R S D Sxx? ? 100%
μ 未知μ 已知
(三)准确度与精密度的关系
1,准确度高, 要求精密度一定高
但精密度好, 准确度不一定高
2,准确度反映了测量结果的正确性
精密度反映了测量结果的重现性
练习
例:用丁二酮肟重量法测定钢铁中 Ni的百分含量,结果
为 10.48%,10.37%,10.47%,10.43%,10.40%;计算单次
分析结果的平均偏差,相对平均偏差,标准偏差和
相对标准偏差。
解:
%43.10?x %036.0
5
%18.0 ??? ?
n
d
d i
%35.0%100%43.10 %036.0%100 ????xd
%046.0106.44106.81 4
72
??????? ?
??
n
d
s i
%44.0%10043.10 %046.0%100 ????xs
三、误差的传递
( 一 ) 系统误差的传递
(二)偶然误差的传递
R f x y z? (,,) ? ? ? ?R x y z,,,
1,加减法计算
2,乘除法计算
R ax by cz? ? ?
? ? ? ?R x y za b c? ? ?
R m x y z? ? ?
? ? ? ?R x y zR x y z/ ? ? ?
1,加减法计算
2,乘除法计算
R f x y z? (,,) zyx SSS,,
R ax by cz? ? ?
2222222 zyxR ScSbSaS ???
R m x y z? ? ?
22222222 / zSySxSRS zyxR ???
标准差法
练习
例:设天平称量时的标准偏差 s = 0.10mg,求称量试样
时的标准偏差 sm 。
解:
mgssssmmm m 14.02,2222121 ????????
练习
例:用移液管移取 NaOH溶液 25.00mL,以 0.1000mol/L的
HCL溶液滴定之,用去 30.00mL,已知用移液管移
取溶液的标准差 s1=0.02mL,每次读取滴定管读数的
标准差 s2=0.01mL,假设 HCL溶液的浓度是准确的,
计算标定 NaOH溶液的标准偏差?
解:
Lm o lV VCC
N a O H
H C LH C L
N a O H /1200.000.25
00.301000.0 ?????
2
2
2
2
2
1
2
1
2
2
2
V
s
V
s
C
s
N a O H
C ??
44
22
101.1102.912.030 01.0225 02.0 ??????
?
??
?
???
?
??
?
??? ?
N a O HC Cs
四、提高分析结果准确度的方法
1,选择合适的分析方法
例,测全 Fe含量
K2Cr2O7法 40.20% ± 0.2%× 40.20%
比色法 40.20% ± 2.0%× 40.20%
2,减小测量误差
1) 称量
例,天平一次的称量误差为 0.0001g,两次的称量误差为
0.0002g,RE% 0.1%,计算最少称样量?
? RE w%,,? ? ? ?2 0 0001 100% 0 1%
gw 2 0 0 0.0??
续前
2) 滴定
例,滴定管一次的读数误差为 0.01mL,两次的读数误差为
0.02mL,RE% 0.1%,计算最少移液体积?
3,增加平行测定次数, 一般测 3~ 4次以减小偶然误差
4,消除测量过程中的系统误差
1) 校准仪器:消除仪器的误差
2) 空白试验:消除试剂误差
3) 对照实验:消除方法误差
4) 回收实验:加样回收, 以检验是否存在方法误差
mLV 20??
? RE V%,,? ? ? ?2 0 01 100% 0 1%
第三节 有效数字及其运算规则
一, 有效数字
二, 有效数字的修约规则
三, 有效数字的运算法则
一,有效数字, 实际可以测得的数字
1,有效数字位数包括所有准确数字和一位欠准数字
例:滴定读数 20.30mL,最多可以读准三位
第四位欠准 ( 估计读数 ) ± 1%
2,在 0~9中, 只有 0既是有效数字, 又是无效数字
例,0.06050 四位有效数字
定位 有效位数
例,3600 → 3.6× 103 两位 → 3.60× 103 三位
3,单位变换不影响有效数字位数
例,10.00[mL]→0.001000[L] 均为四位
续前
4,pH,pM,pK,lgC,lgK等对数值,其有效数字的
位数取决于小数部分(尾数)数字的位数,整数部
分只代表该数的方次
例,pH = 11.20 → [H+]= 6.3× 10-12[mol/L] 两位
5,结果首位为 8和 9时, 有效数字可以多计一位
例,90.0%, 可示为四位有效数字
例,99.87% →99.9% 进位
二、有效数字的修约规则
1,四舍六入五留双
2,只能对数字进行一次性修约
3,当对标准偏差修约时, 修约后会使标准偏差结果
变差, 从而提高可信度
例,s = 0.134 → 修约至 0.14,可信度 ↑
例,0.37456, 0.3745 均修约至三位有效数字
例,6.549,2.451 一次修约至两位有效数字
0.3740.375
6.5 2.5
三、有效数字的运算法则
1,加减法:以小数点后位数最少的数为准 ( 即以
绝对误差最大的数为准 )
2,乘除法:以有效数字位数最少的数为准 ( 即以
相对误差最大的数为准 )
例,50.1 + 1.45 + 0.5812 =?
δ ± 0.1 ± 0.01 ± 0.0001
52.1
例,0.0121× 25.64 × 1.05782 =?
δ ± 0.0001 ± 0.01 ± 0.00001
RE ± 0.8% ± 0.4% ± 0.009%
0.328
保留三位有效数字
保留三位有效数字
第四节 偶然误差的正态分布
一, 偶然误差的正态分布和标准正态分布
二, 偶然误差的区间概率
一、偶然误差的正态分布和标准正态分布
正态分布的概率密度函数式
1,x 表示测量值,y 为测量值出现的概率密度
2.正态分布的两个重要参数
( 1) μ为无限次测量的总体均值,表示无限个数据的
集中趋势 (无系统误差时即为真值)
( 2) σ是总体标准差,表示数据的离散程度
3,x -μ为偶然误差
y f x e
x
? ? ?
?
( )
( )1
2
2
22
? ?
?
?
正态分布曲线 —— x ~ N(μ,σ2 )曲线
? x =μ时,y 最大 →大部分测量值集中
在算术平均值附近
? 曲线以 x =μ的直线为对称 →正负误差
出现的概率相等
? 当 x →﹣ ∞或 ﹢ ∞时, 曲线渐进 x 轴,
小误差出现的几率大, 大误差出现的
几率小, 极大误差出现的几率极小
? σ↑,y↓,数据分散, 曲线平坦
σ↓,y↑,数据集中, 曲线尖锐
? 测量值都落在- ∞~+ ∞,总概率为 1
y f x e
x
? ? ?
?
( )
( )1
2
2
22
? ?
?
?x??
?? 2
1)( ??? xfy
以 x-μ~ y作图
特点
标准正态分布曲线 —— x ~ N(0,1 )曲线
?
??? xu令 2
2
2
1)( uexfy ????
??
dudx ?? ?又 duuduedxxf
u
)(
2
1)( 2
2
?
?
??? ?
2
2
2
1)( ueuy ???
?
?即
以 u ~ y作图
? 注,u 是以 σ为单位来表示随机误差 x -μ
二、偶然误差的区间概率
? 从- ∞~+ ∞,所有测量值出现的总概率 P为 1, 即
? 偶然误差的区间概率 P—— 用一定区间的积分面积表示
该范围内测量值出现的概率
标准正态分布 区间概率 %
?? 1,1 ???? xu %26.68
?? 64.1,64.1 ???? xu %90
?? 96.1,96.1 ???? xu %95
? ????? ???? ? ???? 121)( 2
2u
eduu
?
?
?? 2,2 ???? xu %5.95
?? 58.2,58.2 ???? xu %0.99
?? 3,3 ???? xu %7.99
?? ??uu ?? ~
正态分布
概率积分表
练习
例:已知某试样中 Co的百分含量的标准值为 1.75%,
σ=0.10%,又已知测量时无系统误差,求分析
结果落在 (1.75± 0.15)% 范围内的概率。
解:
5.1%10.0 %15.0%75.1 ?????? ?? ? xxu
%64.868664.04332.02 ????? P查表
练习
例:同上题, 求分析结果大于 2.0% 的概率 。
解:
5.2%10.0 )%75.100.2( ????? ? ?xu
%38.494 9 3 8.0,5.2~0,??Pu 时从当查表可知
%62.0%38.49%00.50'%0.2 ???? P的概率为分析结果大于
第五节 有限数据的统计处理和 t分布
一, 正态分布与 t 分布区别
二, 平均值的精密度和平均值的置信区间
三, 显著性检验
一、正态分布与 t 分布区别
1,正态分布 —— 描述无限次测量数据
t 分布 —— 描述有限次测量数据
2,正态分布 —— 横坐标为 u, t 分布 —— 横坐标为 t
3,两者所包含面积均是一定范围内测量值出现的概率 P
正态分布,P 随 u 变化; u 一定, P一定
t 分布,P 随 t 和 f 变化; t 一定, 概率 P与 f 有关,
?
??? xu
s
xt ???
1?? nf utf ????注:
为总体均值?
为总体标准差?
差为有限次测量值的标准 s
两个重要概念
? 置信度 (置信水平) P, 某一 t 值时,测量值出现在
μ± t ?s范围内的概率
? 显著性水平 α:落在此范围之外的概率
fttP,??下,一定
值的,自由度为表示置信度为
值的,自由度为表示置信度为
tt
tt
4%99
10%95
4,01.0
10,05.0
P?? 1?
二、平均值的精密度和平均值的置信区间
1,平均值的精密度 ( 平均值的标准偏差 )
注:通常 3~4次或 5~9次测定足够
nx
?? ?
x?? ???
xsn,n抽出样本总体 ?
例:
n
ss x
x?
n?4
xx ss 2
1? n?25
xx ss 5
1?
总体均值标准差与
单次测量值标准差
的关系
有限次测量均值标准差
与单次测量值标准差的
关系
续前
2,平均值的置信区间
( 1) 由单次测量结果估计 μ的置信区间
( 2) 由多次测量的样本平均值估计 μ的置信区间
( 3) 由少量测定结果均值估计 μ的置信区间
?? ??? ux
n
uxux x ??? ??????
n
stxstx x
x ???????
n
stxstx x
fxf ??????,,???
总体平均值??
有限次测量均值?x
续前
? 置信区间,一定置信度下,以测量结果为中心,包
括总体均值的可信范围
? 平均值的置信区间,一定置信度下,以测量结果的
均值为中心,包括总体均值的可信范围
? 置信限:
? 结论,
置信度越高,置信区间越大,估计区间包含真值的可能性 ↑
置信区间 —— 反映估计的精密度
置信度 —— 说明估计的把握程度
? ?? u u
x ??? xst ??
? 注意:
( 1) 置信区间的概念,μ为定值, 无随机性
( 2) 单侧检验和双侧检验
单侧 —— 大于或者小于总体均值的范围
双侧 —— 同时大于和小于总体均值的范围
练习
例 1:
%95
%10.0%50.47
在内的概率为包括总体均值
的区间内理解为在
?
?
解:
? ?%95%10.0%50.47 ??? P置信度?如何理解
练习
例 2:对某未知试样中 CL-的百分含量进行测定,4次结果
为 47.64%,47.69%,47.52%,47.55%,计算置信度
为 90%,95%和 99%时的总体均值 μ的置信区间
解:
35.2%90 3,10.0 ??? tP %09.0%60.47
4
%08.035.2%60.47 ??????
18.3%95 3,05.0 ??? tP %13.0%60.47
4
%08.018.3%60.47 ??????
84.5%99 3,01.0 ??? tP %23.0%60.47
4
%08.084.5%60.47 ??????
%60.474 %55.47%52.47%69.47%64.47 ?????x
? ?
%08.0
1
2
?
?
?
? ?
n
xx
s
三、显著性检验
(一)总体均值的检验 —— t检验法
(二)方差检验 —— F检验法
(一)总体均值的检验 —— t检验法
1,平均值与标准值比较 —— 已知真值的 t检验
( 准确度显著性检验 )
nstx ????由 n
s
x
t
??
??
)1( ??? nftP f 自由度时,查临界值表在一定,?
判断:
,则存在显著性差异如 ftt,??
,则不存在显著性差异如 ftt,??
续前
2,两组样本平均值的比较 —— 未知真值的 t检验
( 系统误差显著性检验 )
设两组分析数据为:
1n 1s 1x
2n 2s 2x
21 ss ?当
? ? ? ?
? ? ? ?11 21
1
2
22
1
2
11
???
???
??
??
??
nn
xxxx
s
n
i
i
n
i
i
R
总自由度
偏差平方和
合并标准差
? ? ? ?
? ? ? ?11
11
21
2
2
21
2
1
???
?????
nn
nsnss
R
续前
21
2121
nn
nn
s
xx
t
R ?
????
)2( 21 ???? nnftP f 总自由度时,查临界值表在一定,?
判断:
著性差异,则两组平均值存在显如, ftt ??
显著性差异,则两组平均值不存在如, ftt ??
(二)方差检验 —— F检验法
(精密度显著性检验)
? 统计量 F 的定义:两组数据方差的比值
21,,ffFP ?一定时,查
判断:
不存在显著性差异,则两组数据的精密度如 表FF ?
存在显著性差异,则两组数据的精密度如 表FF ?
2
2
2
1
s
sF ?即 ? ?21 ss ?
显著性检验注意事项
1,单侧和双侧检验
1)单侧检验 → 检验某结果的精密度是否大于或小于 某值
[F检验常用 ]
2) 双侧检验 → 检验两结果是否存在显著性差异
[ t 检验常用 ]
2.置信水平的选择
置信水平过高 —— 以假为真
置信水平过低 —— 以真为假
四、异常值的检验 —— G检验( Grubbs法)
检验过程:
sxxxxxx nn 和??,,,,,1321 ??
s
xx
G
?
? 异常
判断,保留,则异常值舍弃;否则下,若一定, NGGP ??
小结
1,比较:
t 检验 —— 检验方法的系统误差
F 检验 —— 检验方法的偶然误差
G 检验 —— 异常值的取舍
2,检验顺序:
G检验 → F 检验 → t检验
异常值的
取舍
精密度显著性
检验
准确度或系统误
差显著性检验
练习
例:采用某种新方法测定基准明矾中铝的百分含量,
得到以下九个分析结果,10.74%,10.77%,
10.77%,10.77%,10.81%,10.82%,10.73%,
10.86%,10.81%。试问采用新方法后,是否
引起系统误差?( P=95%)
8199 ????? fn %042.0%,79.10 ?? Sx
43.19%042.0 %77.10%79.10 ????t
31.28,95.0 8,05.0 ??? tfP 时,当
之间无显著性差异与因 ?xtt ?? 8,05.0
解:
练习
例:在吸光光度分析中,用一台旧仪器测定溶液的吸光
度 6次,得标准偏差 s1=0.055;用性能稍好的新仪器
测定 4次,得到标准偏差 s2=0.022。试问新仪器的精
密度是否显著地优于旧仪器?
0 0 0 4 8.0,0 2 2.0,4
0 0 3 0.0,0 5 5.0,6
2
22
2
11
???
???


ssn
ssn
25.600048.0 0030.0 ??? F
01.935%,95 ????? 表小大,由 FffP
显著性差异两仪器的精密度不存在表 ?? FF
解:
练习
例:采用不同方法分析某种试样, 用第一种方法测定
11次, 得标准偏差 s1=0.21%;第二种方法测定 9次
得到标准偏差 s2=0.60%。 试判断两方法的精密度间
是否存在显著差异? ( P=90%)
解:
36.0%,60.0,9
0 4 4.0%,21.0,11
2
22
2
11
???
???


ssn
ssn 2.8
0 4 4.0
36.0 ??? F
07.3108%,90 ????? 表小大,由 FffP
著性差异两方法的精密度存在显表 ?? FF
练习
例:用两种不同方法测定合金中铌的百分含量
第一法 1.26% 1.25% 1.22%
第二法 1.35% 1.31% 1.33% 1.34%
试问两种方法是否存在显著性差异 ( 置信度 90%)
%02 1.0%,24.1,3 111 ??? sxn
%017.0%,33.1,4 222 ??? sxn
53.1
)0 1 7.0(
)0 2 1.0(
2
2
2
2
2
1 ???
s
sF
55.932 ??? 表小大,,Fff
著性差异两组数据的精密度无显表 ?? FF
解:
续前
019.0
1
)()(
21
2211
?
??
???
? ? ?
nn
xxxx
s iiR
21.6
43
43
019.0
33.124.1
21
2121 ?
?
????
?
????
nn
nn
s
xx
t
02.25243%90 5,10.0 ?????? tfP 时,,当
显著性差异两种分析方法之间存在?? 5,01.0tt
练习
例:测定某药物中钴的含量, 得结果如下:
1.25,1.27,1.31,1.40μg/g,试问 1.40这个数据是否
应该保留?
36.1066.0 31.140.1066.0,31.1 ???
?
???? s
xx
Gsx 异常
46.14,95.0 4,05.0 ???? GnP
这个数应该保留40.14,05.0 ?? GG?
解: